周鸿祎：很多企业百亿级大模型就能满足需求，千亿级是成本浪费

时间：2023-06-26 18:00:17 来源：澎湃新闻

周鸿祎“人工智能的发展要‘以人为本’，大模型不能引发大规模裁员，而是要帮助企业员工提升能力和效率，成为易用的工具。”6月26日，在世界互联网大会数字文明尼山对话主论坛上，三六零(601360.SH，下称“360”)创始人周鸿祎再次谈到他对大模型的看法，首次提到现有公有大模型存在四方面不足之处：

他表示，第一，公有大模型虽然是通才，但它缺乏行业深度，“我们之前认为GPT什么都会，但如果你是一个行业专家，你会发现GPT在安全、金融这些垂直领域，知识深度是不够的。很多公司自己训大模型都发现了这个特点，想让它能力很均衡，就会牺牲深度。”周鸿祎表示。

他认为，未来垂直大模型是重要的发展方向，通用模型和各领域专有的知识数据结合，让大模型从“万事通”变成政府通、行业通和企业通，这才是真正的价值，“最新资料表明，GPT4也是由8个垂直模型组成的，从侧面印证了这个观点。”

(资料图片仅供参考)

第二，公有大模型容易造成企业内部数据泄露。一方面，公有大模型不是本地部署，它与外部进行信息交流时必然存在数据泄露的风险；另一方面，公有大模型也无法实现组织内部权限的分级管理。因此，政府、企业使用公有大模型必然存在安全风险。

第三，对企业来讲，公有大模型无法保障内容真正可信。周鸿祎表示，大模型存在“幻觉”，也就是常说的一本正经地“胡说八道”，经常出现张冠李戴的问题，需要通过企业的内部搜索、内部知识库进行矫正。

第四，公有大模型无法实现成本可控。他举例称，许多企业其实只需要大模型写代码的能力，百亿级垂直大模型就能满足需求，如果使用千亿级大模型就是成本的浪费。在控制成本方面，垂直大模型将会有很大优势。在用公开数据训练的“通识”大模型基础上，训练专有大模型，就能做到“事半功倍”，为企业降本增效。

以下为演讲全文：

大家好，感谢主办方的邀请，很高兴参加尼山对话。今天我们讨论的主题聚焦“构建安全可信的人工智能”、“人工智能赋能百行千业”，最近360自研的认知大模型智脑也在相关方向有探索，借今天的机会，我想分享一些实践中得到的经验和思考。

这次GPT大模型的诞生代表着通用人工智能、强人工智能的到来，是真正的智能涌现。大模型能够真正地理解人类所有的语言，能够很自然地做出各种交流和推理，这意味着人工智能第一次完整地理解了我们人类世界的知识，并且已经从感知进化到了认知，不仅能够理解文字、语言，还能做出分析、规划。未来，传统算法将被代替，大模型在自动驾驶、机器人控制、蛋白质分析等很多重要领域都会大显身手。

目前产学研各界已经形成了共识，GPT大模型将会带来一场新的工业革命。我们都知道，数字时代最重要的是大数据，但大数据就像“石油”，难以直接使用。GPT的出现就像发电厂，把大数据从“石油”加工成了“电”，赋能百行千业。如今数字化已上升为中国的国家战略，其中产业数字化是重要的发展机遇，我认为产业数字化的终极目标就是智能化，而GPT大模型将会成为产业数字化重要的赋能者。

在这场工业革命中，大模型真正的机会在企业市场，作为生产力工具提升企业生产率。ChatGPT虽然是靠聊天功能“破圈”的，但这只是它的一种“亲民伪装”，实际上大模型绝对不是一个娱乐工具，而是工业革命级的生产力工具。如果大家留意就会发现，即使是个人消费者，最终还是会用大模型满足刚需，应用在办公场景里，成为提高办公效率的工具，比如公文写作等等。因此我认为，企业级市场才是大模型未来发展真正出彩的地方。

但是，当我们带着通用大模型真正走进政府、城市、行业、企业时就会发现，公有大模型无法直接使用。因为公有大模型存在以下四点不足：

第一，公有大模型虽然是通才，但它缺乏行业深度。我们之前认为GPT什么都会，但如果你是一个行业专家，你会发现GPT在安全、金融这些垂直领域，知识深度是不够的。很多公司自己训大模型都发现了这个特点，想让它能力很均衡，就会牺牲深度。所以未来垂直大模型是重要的发展方向，通用模型和各领域专有的知识数据结合，让大模型从“万事通”变成政府通、行业通和企业通，这才是真正的价值。最新资料表明，GPT4也是由8个垂直模型组成的，从侧面印证了这个观点。

第三，对企业来讲，公有大模型无法保障内容真正可信。这主要包含两个问题：一个是企业在日常生产经营过程中，知识库是实时产生的，并且不断变化。它不像公有大模型的通用知识，是一成不变的“百科全书”。因此，企业使用公有大模型无法满足时效性的需求。另一个是大模型自身的“幻觉”问题，也就是我们常说的一本正经地“胡说八道”。公有大模型经常出现张冠李戴的问题，需要通过企业的内部搜索、内部知识库进行矫正。这些都需要专有大模型才能实现。

第四，也是很多企业级用户关注的，公有大模型无法实现成本可控。举个例子，很多企业其实只需要大模型写代码的能力，这时候公有大模型写诗、写论文的能力就是多余的。也就是说，很多企业只需要百亿级垂直大模型就满足需求，如果使用千亿级大模型就是成本的浪费。这个成本不只是大模型的采购成本，还包括训练成本、部署成本、微调成本。在控制成本方面，垂直大模型将会有很大优势。因此，在一个用公开数据训练的“通识”大模型基础上，训练专有大模型，就能做到“事半功倍”，为企业降本增效。

大模型想要成为企业级的智能化赋能工具，必须要行业化、专有化，从万事通变成城市通、行业通、企业通。而企业落地大模型则需要分步来实现。我认为目前的当务之急叫做“小切口大纵深”，先把大模型最擅长、最成熟的能力用好。刚开始可以从办公场景入手。因为大模型不是万能的，最擅长最成熟的能力肯定是自然语言处理。而且办公场景能做到松耦合，与现有的业务系统无缝融合。具体来说，一些细分场景包括信息分析、知识管理、内容创作和智能客服等，让员工上手尝试，慢慢发掘大模型的能力，对大模型逐渐熟悉，之后再将大模型与业务进行深度融合。这样大模型的发展才能可控易用。

企业级场景要打造 “安全可信、可控易用”的专有大模型，我们在实践过程中也总结了一些心得，需要坚持五个原则，包括：安全原则，企业级应用必须是安全的大模型；可信原则，大模型要解决准确性、实时性的短板问题；可控原则，坚持把大模型定位在辅助工具上，确保人始终在业务决策的回路上；易用原则，这里面“数字人”、“数字员工”有很大的想象空间；最后是普惠原则，要让每个人都能用起来。时间关系，这里我想重点分享一下易用原则。

人工智能的发展要“以人为本”，大模型不能引发大规模裁员，而是要帮助企业员工提升能力和效率，成为易用的工具，让每个普通员工都能真正用起来。因此我认为，未来面向企业，数字员工会成为非常重要的一个概念。相比和机器进行复杂的交互，与“人”对话更符合我们的日常习惯，数字员工将大大降低大模型的使用门槛。未来也不只企业老板能拥有数字员工做助理，每个企业员工都能有若干数字助手，比如法务助理、财务助理、市场助理，来协助创作、策划、分析、总结等日常工作。

最后我想说，人工智能大模型这场工业革命已经到来，未来大模型在各个城市、各个行业、各个企业里将得到充分应用，市场的机会也才刚刚开始。360也将发挥过往在人工智能领域积累的经验和优势，帮助各地构建“安全可信、可控易用”的大模型，为产业数字化转型到智能化升级，贡献自己的一份力量。

谢谢大家！

(本文来自澎湃新闻，更多原创资讯请下载“澎湃新闻”APP)

标签：