声明:本文原创为 虎嗅APP


大模型的新一轮军备竞赛要开始了。

通俗地讲,Scalinglaw就是通过更大规模的数据量和更高的算力,再加上更大参数的模型,让大模型能够处理更复杂的任务。最终,各家基础大模型公司的竞争方向就是砸钱堆算力。

但这似乎是个无底洞,一些公司选择了更正确的方式,开始通过积极寻求大模型商业化来应对这场持久战,并以实际应用的反馈来提升大模型的能力,百度便是其中之一。

最新发布的2023年Q4和全年财报显示,2023年总营收达1345.98亿元,归属百度的净利润(non-GAAP)287亿元,同比增速达39%。2023年,百度全年营收和利润均超市场预期。其中,以文心大模型与文心一言为代表的AI业务商业化方面取得重大进展。

这是大模型竞争逻辑转变的一个重要信号:大模型的训练、迭代升级不再是闭门造车,而转向实战。

这意味着大模型商业化能力的重要性进一步提升。一方面,市场将选择出最符合实际需要的大模型产品;更重要的是,通过自我造血,大模型训练需要持续投入的巨额资金才更有保证。

实战是大模型最好的训练场

在基础大模型领域重新锚定了10亿美元的入场资格之后,势必有一部分公司会被挤下牌桌。
这些面临竞争挑战的公司中,有很大比例是去年ChatGPT走红之后,才涌入基础大模型领域的创业公司。这些公司从零起步,对大模型的认识也不够深入,其训练的模型在理解、生成、逻辑和记忆能力没有足够的竞争优势,团队在寻求大模型商业化落地场景中也屡遭碰壁。
在新的竞争形势下,有能力参与大模型接下来竞争的公司都拥有更深的技术积累和市场认知。从进入大模型的时间来看,无论是创业公司的头部公司,还是互联网大厂里的做得好的公司,都是在ChatGPT走红之前,就看到了大模型的机会,并开始了布局。
比如,智谱AI和MiniMax分别成立于2019年和2020年,百度也在2019年3月就发布了文心大模型1.0版,他们在ChatGPT发布时已历经了三四年的技术深耕和研发迭代。去年10月,文心大模型已升级到4.0版本,在理解、生成、逻辑和记忆能力上都有着显著提升,综合水平与GPT-4相当。
这也意味着大模型的竞争已进入硬仗阶段。目前,最早一批研发的基础大模型都已开启商业化,对外开放调用之路,这也让这些大模型拥有了实践检验的机会,收获更强的市场竞争力。
据了解,三星、荣耀、汽车之家均与百度达成合作,调用文心大模型来提升产品的AI能力。其中,三星在最新款的S24旗舰手机上集成文心大模型的多项能力,包括通话、翻译、智能摘要等功能。尤其是 “即圈即搜” 功能,用户可以通过简单的手势操作在文字、图片或视频上进行圈画或划线,即可立即获得精准的搜索结果。

而此前百度公布的信息显示,截至去年12月底,文心一言用户规模突破1亿,累计完成了37亿字的文本创作,输出了3亿行代码,帮助用户处理了累计4亿字的专业合同,制定了500万次的旅行计划。

而去年11月,百度创始人兼CEO李彦宏在公开演讲时称,全国有200多家大模型,“文心大模型一家的调用量比这200多家大模型的调用量加起来还多。”

在百度2023年第四季度及全年财报电话会上,李彦宏透露了文心大模型的最新数据:文心大模型的日调用量已超过5000万次,季度环比增长190%;12月,约有2.6万家企业调用文心大模型,季度环比增长150%。

文心大模型日调用量持续上涨,相比于还在闷头训练的大模型,庞大的调用量给予文心大模型更多反馈,反向促进了文心大模型的能力提升,形成飞轮效应
真实的应用是文心大模型能力提升的最佳催化剂,同时也让百度能够更加精准洞察到市场需求,让大模型图文、视频等方向的迭代朝着市场需要的放心迭代进化。

市场会选择什么样的大模型?

技术能力是大模型能够获得市场认可的关键因素,但不是唯一的因素。
当下市场对大模型的需求主要集中在翻译、文案、客服、文档处理等多个方面,对大模型有需求的相关企业或是为了通过提升用户体验来获得更好的市场份额,或者通过技术提升公司内部的工作效率,背后都包含着成本和收益的核算。
从抽象层面来说,只有大模型给这些企业带来的收益高于使用成本,他们才愿意使用。而从具体的应用场景来说,不同企业考量的成本因素也各不相同。比如,一些原本技术能力薄弱公司在调用大模型的过程中,如果需要从0到1搭建一个专业的技术团队,这可能会最终促使其放弃,因为这个过程中涉及了非常复杂的沟通和管理成本,做不好还可能会赔了夫人又折兵。
经历过实战检验的大模型,才有可能洞察到不同客户的真实需求和顾虑。比如,作为国内最早一批开启商业化的基础大模型,文心大模型在和客户沟通过程中,洞察到了成本和使用门槛方面的顾虑,并结合自身的技术能力和市场需求,进行了改进。
在平衡成本和收益上,百度通过四层技术架构优势和端到端优化能力,不断降低文心大模型推理成本,提升效率。李彦宏在财报电话会上透露,自去年3月文心一言发布以来,文心大模型的推理成本已经下降至原来的1%。通过文心和飞桨的协同优化,文心大模型的周均训练有效率超过98%,训练算法效率提升3.6倍,推理性能提升50倍。对于企业和开发者来说,文心大模型已成为性价比最高的大模型。
而在降低开发门槛和内部的管理成本上,文心大模型通过千帆AppBuilder和千帆ModelBuilder两个应用开发工具解决了技术能力薄弱公司的顾虑。其中,AI原生应用开发工作台AppBuilder可以让不懂代码的小白通过可视化工具组件搭建AI原生应用;ModelBuilder提供了一整套大模型开发的工具链,支持专有模型的开发和模型精调,开发者在上面精调和开发专有模型更简单,而且性价比更高。
目前,千帆AppBuilder不仅为开发者提供了丰富的开发套件和应用组件,而且提供了门槛更低的低代码态,而千帆ModelBuilder已累计精调了10000个模型。
同时,百度还提供了多个尺寸的大语言模型,如 ERNIE Turbo、ERNIE Speed、ERNIE TIny等,这些模型可以在模型效果和效率之间取得平衡,更好满足各类客户场景需求。
从各家大模型的调用量来看,市场选择大模型,是在成本和收益、开发门槛等方面权衡之后用脚投票的结果。
作为支持生成式AI落地的技术设施,基础大模型在竞争中也将呈现和互联网平台类似的趋势:具备先发优势、能够率先满足各式各样市场需求并降低使用门槛的平台,将呈现强者愈强的趋势。
一旦某一个平台在市场份额上占据绝对优势,其他平台将很难再与其竞争。从这个角度来看,文心大模型当前积累的优势在接下来新的竞争形势下,拥有了更多竞争力。

更多营收才意味着更大想象力

如果说基础大模型在2023年开了商业化的头,那么其在2024年则将让市场呈现出更明显的头部效应。
就拿文心大模型来说,其带来的更多营收可能性,也将给百度在大模型竞争中增加很多底气。
一方面,AI营销新工具正在重构内容和广告生态,提高企业的内容生产和广告投放效率,让广告主和平台共同收益。目前,百度发布了营销平台“轻舸”、品牌智能体等AI营销新工具,与飞鹤、洋河、京东、海尔等品牌达成合作并落地。比如,飞鹤基于品牌智能体打造了“飞鹤官方智能助手”,在百度搜索上,用户可以直接向飞鹤官方智能助手咨询,文本对答的表现形式更能满足用户个性化需求,提升商品匹配效率。
另一方面,更多AI应用的上线,将提升用户生活、工作、学习效率,也让AI原生应用公司获得更多收益。在通过调用形式服务更多第三方客户的同时,百度自身的产品也在通过AI应用重构,提升用户体验。比如,重构后的百度文库推出了智能文本生成和编辑、智能PPT生成和编辑等AI新功能,这些新功能累计使用超7亿次,拉动百度文库AI用户超8000万,势必也会拉动百度文库用户付费收入的提高。
财报显示,在旗下产品及服务的AI原生化重构的带动下,2023年12月,百度App月活用户达到6.67亿,2023年全年在线营销收入751亿元,四季度在线营销收入192亿元。
CMB招银国际预计,百度生成式AI相关的广告和云的收入增长在2023年第四季度步入正轨,并将推动2024年的进一步收入增长。而摩根士丹利预计,2024年,生成式AI技术将为百度带来约30亿元人民币的广告增量收入。

此外,李彦宏还在财报电话会上透露,百度智能云四季度总营收84亿元,其中大模型为云业务带来约6.6亿元增量收入。

百度核心业务保持韧性和健康发展,这也是未来其继续坚定对生成式AI和基础模型的投入,为创造新增长引擎奠定基础。

文心大模型给百度带来更多的营收,还意味着百度有能力把更多资金投入到大模型数据和算力的提升上,让文心大模型在理解、生成、逻辑和记忆能力上有更进一步的提升,也可以让百度在大模型的训练、研发上进行更多尝试,在不远的将来研发出国内版的Sora,甚至是一个市场上还不存在的全新大模型产品,来满足更多元化的内容生产需求。
未来基础大模型领域的竞争已经非常明确,谁能够在数据和算力端投入更多,谁将有更大的可能成为AI原生时代的操作系统,一统江湖。这个过程除了考验基础大模型公司当下的资金实力之外,还在很大程度上依赖大模型本身带来的造血能力。
这考验的正是各个基础大模型当下的商业化能力。

免责声明:转载文章仅用于学习交流,不代表本站观点。版权属原作者所有,如有疑问请来信告知: AIS.editor@intelleagle.com.cn