大模型应用祛魅:躬身入局千行百业

本报记者李玉洋上海报道

经历去年的“百模大战”之后,业内已经认识到,今年应该推动大模型进入“应用落地元年”。正如百度创始人李彦宏在2024年世界人工智能大会(WAIC)上再次强调的:“百模大战”造成极大的算力浪费,没有应用,光有基础模型,不管是开源还是闭源,都一文不值。

“过去一段时间,行业正逐步从卷模型到卷应用,企业和用户从关注哪些模型最强,到关注哪些模型能够在自己的场景里用起来,以及到底能够带来什么样的实际价值。”李彦宏说。

《中国经营报》记者注意到,本届WAIC其实已经展示了多种针对B端市场的场景应用,比如蜜度基于蜜巢政务大模型3.0的应用产品——智能舆情V助手1.0;阶跃星辰携手国泰君安等券商推出的金融大模型;网易展示的教育大模型“子曰”;以及多模态大模型“易生诸相”在游戏、教育、音乐、文旅等领域的落地。

这种情况符合此前“L1级大模型(行业大模型)的商业化路径相比L0级大模型(基础大模型)更短一些”的行业共识。那么,垂直类大模型落地应用究竟该怎么做?千行百业的B端市场运用L1级大模型的内部逻辑是什么?

国内智能客服独角兽容联云产业数字云VP兼诸葛智能创始人孔淼对记者表示:“企业级的需求不是购买一个工具,而是用先进技术改造生产力,去优化生产关系。企业不会为一个比较fancy(花哨的)的新技术买单,他们要的是基于整个技术的完整的业务解决方案的提升。”

容联云是国内最早一批探索大模型在金融营销领域落地应用的企业,他们的思考和经验值得借鉴。“大模型落地应用是一个比较复杂的过程,需要综合考虑多方面因素,比如技术成熟度、数据隐私和安全问题、跨学科合作等。”该公司Minimax副总裁刘华表示。

大模型落地最快的行业

“自从大模型出来之后,从技术可行性层面上说,智能客服是最成熟、最容易落地的场景,不管是海外还是国内。”容联云大模型产品负责人唐兴才表示,在AI1.0时代,小模型也是最先在智能客服领域实现商业化落地。

记者注意到,金融业是智能客服应用程度最高的行业,大模型在该场景的应用正成为行业创新热点,而智能客服是金融大模型的重点领域之一。不仅众多金融机构纷纷加大投入,百度、阿里巴巴、腾讯、京东、科大讯飞等互联网大厂也在把触角伸进这个赛道。

其实在2023年,为了让大模型尽快落地应用,包括百度云、阿里云、腾讯云等国内云厂商们便开始了早期商业化探索,推出MaaS(Model-as-a-Service,模型即服务)模式进行商业化尝试。

“我们和大模型厂商的逻辑不太一样,之前他们提的MaaS其实是为了推通用大模型的API,比如智谱大模型打出来的口号就是赋能千行百业。”唐兴才表示,这些通用大模型厂商推出MaaS模式,是想通过垂直行业厂商把大模型能力与行业落地的“最后一公里”打通,“它(大模型)有一个纯粹的chat(聊天、谈话)能力,但不知道落地的场景和业务点是什么,直接到千行百业去啥也做不了”。

唐兴才指出,他们在做大模型落地的时候会发现两类客户:一类是能接受MaaS这种方式,能比较低成本地快速启动;另一类是觉得通用大模型对行业化的理解有问题,需要训练自己的L1模型,随之就要考虑私有化或再次训练的成本问题。

孔淼则进一步做了解释。“我们面向于客户提供两种选择,第一个是用我们的L1级大模型,我们帮客户部署;还有一种是客户自建了大模型的基础设施,我们就通过平台层的模型管理能力接入它的模型,提供我们上层的应用服务能力。”他还指出,另一类比较偏SaaS类,容联云和腾讯混元模型、字节跳动的豆包以及华为的盘古大模型的合作就是这种,“这是应用厂商一个比较灵活的好处,即有各种不同的方案”。

据了解,容联云在2023年发布了自研赤兔大模型和生成式应用,又在2024WAIC期间官宣了容犀智能大模型的应用升级(该系列应用包括容犀AgentCopilot、容犀KnowledgeCopilot、容犀CoachAgent等),覆盖了从营销、销售、服务到企业内部管理的核心场景。

“今年是大模型应用落地元年。”孔淼表示,该公司目前行业客户比较多,他们都需要私有化部署,而通用人工智能解决不了行业知识、行业流程以及行业业务的问题,所以这些都需要垂直行业应用技术服务厂商去解决,“目前跑得比较快、成熟度比较高的,其实主要是金融行业”。

L1级模型落地难点

谈到与大模型厂商的竞争,孔淼表示,在大模型时代,做应用的厂商和这些大厂不存在必然的竞争关系,“他们(大厂)很清楚自己的边界在哪儿,我们也很清楚自己的边界,我们各有各的路。”

孔淼还指出,在互联网时代,大家可能会有冲突,大厂可以用互联网能力覆盖一切,但在大模型领域则更多是一种生产力思维。“企业的业务流程怎么用先进的生产力转化成新的应用,去降本提效,在这背后,纯模型解决不了落地的复杂工程问题和业务运营管理问题。”孔淼表示,大模型厂商无法将业务细节都了解得很清楚,因为千行百业的每一个细化都很深,而这就是灵活的应用厂商能开展业务的空间。

经过一年发展,产业界对大模型的态度也发生了巨大改变。“客户对于大模型的态度,从怀疑它到相信它无所不能,这种情况让我们震撼。”政务大模型公司蜜度科技股份有限公司首席技术官(CTO)刘益东如此表示。

唐兴才也有类似观感。他认为这里面有几个方面的原因:“一是确实有一些大模型应用场景落地了,一些大厂或是龙头公司起步比较早,让大模型在一些场景落地了;二是大模型也在迭代,从最初的提到大模型就意味着要投入大量算力,到现在应用落地能接受消费级显卡或几张卡就能在一个场景里做得不错,大家对算力投入成本完全不是一个概念了。”

不过,唐兴才对这个态度转变作出了提醒:“作为厂商,我们有一个担心就是大家认为大模型啥都能做,其实有一个预期太高的风险在里面。”

目前,容联云把大模型服务应用在头部的股份制银行和保险公司里了。“这种收入有,但体量还没那么大。”唐兴才表示,结合海外类似的数据预估,智能化接待或智能化服务应该有30%~40%的年增长率。

当然,L1级模型在落地过程中仍有挑战。“我觉得第一个还是算力成本,第二个是模型本身的可解释性比较差,还要对它的幻觉进行控制。”孔淼说。

“当大模型的错误率从30%、40%降低到3%、4%,赋能实体经济会变得更加自然。”MiniMax创始人、CEO闫俊杰这样表示。

此外,孔淼认为对于行业和场景的选择,也是大模型应用的一个难点。比如某个行业、场景有可能大模型应用叫好不叫座,也就是说做得不错但卖不了钱,怎么快速去做商业化的变现,这也是问题和挑战。

智谱AICEO张鹏则认为,大模型超级应用的出现并非完全是技术驱动的事情,它涉及很多因素,大模型应用祛魅:躬身入局千行百业比如市场、用户是否准备好了,这需要时间的沉淀。举例而言,谷歌从打造出世界第一的搜索引擎,到探索出成功的商业落地路径,花了6年;而现在的Meta,原来的Facebook也同样如此。

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文