在过去半年,科技圈的多数震荡都与大模型紧密绑定在一起。2023年4月,百度率先发布了文心一言大模型,此后,国内各大互联网公司和创业新秀争先想要留下浓墨重彩的一笔。
而在刚刚过去的第六届世界人工智能大会上,大模型同样成为全场的绝对主角。30余款大模型集中亮相,20多场大模型论坛应接不暇。相关展台无一例外被参观者挤得水泄不通,几十个人紧紧围着一台电脑,等待着“奇迹”的出现——只需不到2分钟,一份完整清晰的行业分析报告就能呈现在看客眼前。
“不到一上午,宣传资料基本都被抢光了。”多位展商员工向时代财经表示,外界对大模型保持着极大的热情。
在会场展出的30多款大模型之中,不乏一些已经闻名业界的通用大模型。如百度推出的文心一言、阿里巴巴旗下的通义千问、华为的盘古大模型、科大讯飞的星火认知、商汤的日日新sensenova等。
除此之外,澜舟科技、衔远科技、出门问问、星环科技、蜜度、达观数据等一众中小厂商面向细分场景推出的垂直大模型同样成为“百模齐放”中的重要一极。它们希望通过采用更精准的行业数据,更低成本解决特定应用场景内的特定问题。
但无论是大厂,还是垂直厂商,AI+行业解决方案已是标配。大模型展区宛如一个超级市场,各种解决方案琳琅满目。
“通用大模型可以在100个场景中,解决70%—80%的问题,但未必能100%满足企业某个场景的需求。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生如此说道。在他看来,通用大模型有很强的能力,但并不能解决很多企业的具体问题。企业基于行业大模型构建自己的专属模型,也许是更优的选项。
向行业大模型跋涉
上月底,知名投资人朱啸虎与猎豹移动董事长兼CEO傅盛之间曾发生一次激烈争论。前者认为大模型摧毁了创业,因为资源普遍集中于资历雄厚的大厂,而后者认为大模型催生了很多新的架构在大模型之上的机会。
可在争吵过后,市场却意外发现这两位资深互联网人在另一个维度上达成共识:行业大模型以及基于大模型的应用开发,才是大部分企业真正能够抓住的机会。
这似乎也成了一众厂商的共识。大厂纷纷推出基于自身大模型的技术基座,向各行各业开放,为企业部署大模型提供一站式端到端支持。
如至今没有公布通用大模型“混元”进展的腾讯,就在6月中旬先高调公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。华为盘古大模型3.0更是喊出“不作诗,只做事”的口号,要在行业领域赋予价值。
时代财经注意到,在百度文心一言、阿里通义千问的展位上,最受欢迎的同样是“企业级平台”“专属大模型”等主题,来询问的企业客户络绎不绝。
一位现场大模型销售人员向时代财经透露,在展区内停留的行业用户一般都有一个明确的要求:想要产品实现一站式服务,并且能够实现个性化的定制。
潞晨科技、竹间智能等中间层企业也开始推出各种降低大模型成本的解决方案。如潞晨科技展出的Colossal-AI就致力于用算法技术帮助中小企业降低大模型的调用成本。相关解决方案已在自动驾驶、云计算、零售、医药、芯片、金融等行业落地应用。
竹间智能旗下的“模型工厂”,同样以帮助企业以更低成本、更快定制个性化的大模型为最大卖点。通过这一大模型管理平台,竹间智能可以帮助企业快速地将大模型做私有化训练,并且落地下来。“我们要做的就是端到端最后一公里的落地应用。”现场一位竹间智能员工如此总结道。
各个垂直大模型厂商更是基于自身积累的数据优势,直接推出更具针对性的行业大模型,方便客户调用。
如语言智能科技企业蜜度就基于自己多年服务G端客户的经验,带来了辅助政务公文写作的蜜巢知识问答与内容生成大语言模型。大数据基础软件供应商星环科技则重点展示了面向金融量化领域的星环无涯金融大模型,该大模型支持股票、债券、基金等市场事件的全面复盘、总结和演绎推理,以及政策研报的深度分析。
星环科技创始人兼CEO孙元浩在大会上指出,未来在金融、政府、能源、交通等每一个行业与领域,都会诞生领域或者行业的大模型,这些大模型具有专家的能力,可以在上面构造复杂的应用。
但当人们环绕整个会场,这样一句预言似乎早已成为现实。大模型+金融、大模型+医疗、大模型+教育、大模型+工业……这个名单似乎可以无止境地列下去。无论是大厂,还是垂直厂商,几乎所有人都在向行业大模型跋涉。
应用仍待落地
不过,作为一项仍未完全成熟的技术,行业大模型的落地之路仍面临诸多阻碍。
一方面是监管仍待落地。现场几乎所有的大模型产品都还没有全面开放API接口服务,如百度、阿里就只供定向邀约客户使用。在接受时代财经采访时,科大讯飞总裁吴晓如指出,目前在互联网或者公开的开放平台上,还需要等到监管机构发牌以后,才能正式运作。“目前很多开发者只能通过预体验的形式,将他们的应用和我们的系统进行对接。”
与此同时,有现场大模型销售人员向时代财经透露,目前不少前来接洽的企业都有着相似的顾虑,其中就包括大模型的不稳定问题。
在大模型展区待了大半天、刷遍所有公司推出的大模型应用产品的工程师李捷也有同感。他所在的通信公司想借助大模型实现业务端问答场景的落地,但从这半天的试用结果来看并不乐观。
“没有太多惊喜,大多垂直厂商的落地场景还是语音客服和文字客服,而且内容输出的精准度不高,答错现象也是屡见不鲜。”
对于C端用户而言,大模型一本正经胡说八道的“机器幻觉”也常被调侃。但如果要接入金融、医疗、工业制造等严肃B端场景,这一潜在风险就可能造成经济损失或直接威胁生命安全。
“大模型最大的不足就是‘幻觉’,正式商用是不允许有‘幻觉’的。”在头部自动驾驶厂商担任技术经理的张启向时代财经强调。
市场的另一个关注重点是大模型的数据安全问题。高质量的数据是助力AI训练与调优的关键,足够多、足够丰富的数据,是生成式AI大模型的根基。
据《机器之心》报道,绝大部分企业不可能把敏感的内部数据上传,比如产品设计、技术架构、核心代码、制造工艺、配方、客户隐私,会议纪要,战略文档,业务规划,商业逻辑等,一定要保留在内部,特别是对于国央企、金融、能源、大型集团企业、先进制造等数据敏感性较高的行业而言。
如此一来,大模型厂商似乎只能采取定制化思路,为企业打造专属大模型。但在张启看来,如果行业大模型要针对企业进行个性化的开发,背后需要付出大量数据和时间去训练,成本很高、难度很大,这笔账很难算得清楚。
“现阶段,很多企业都难以将业务需求与大模型结合起来,这无疑延长了大模型企业的服务周期。”一位澜舟科技员工同样向时代财经说道。
类似的困境已经在云服务厂商身上上演。曾被视为互联网大厂增长第二极的云服务在历经多年竞争之后,陷入服务同质化的困境,只能依靠大打价格战抢夺市场,集体陷入低毛利的螺旋陷阱。
如何跨越这些难题,成为大模型是否能够真正落地应用的关键。这一被认为终将改变世界的新技术,目前还走在黎明前夜。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
深度