大模型热潮一年,落地应用成为行业关注的焦点
大模型热潮一年,落地应用成为行业关注的焦点
每经记者 可杨每经编辑 梁枭
大模型热潮一年,落地应用成为行业关注的焦点。
12月19日,百川智能宣布开放基于搜索增强的-Turbo系列API,包含-Turbo-192K及-Turbo。在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。即日起,API(即应用程序接口)用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。
这是百川智能在商业化层面的一步探索。谈及大模型的落地应用,百川智能创始人、CEO王小川在交流会上表示:“光靠模型本身做得再大都是不够的,大模型+搜索才能构成完整的技术栈。”
谈商业化:用行业大模型解决企业应用不是最佳方法
“大模型走向实用,都呼吁模型落地,在今天,尤其从国内来看,搜索增强是大模型走向实用的第一步,甚至是最关键的一步。没有搜索增强的大模型在企业里是没法落地的。”王小川认为。
尽管大模型是划时代的技术突破,但现阶段大模型并不完美,幻觉、时效性差、缺乏专业领域知识等问题,是其落地千行百业必须面对的挑战。
王小川表示,众所周知,在大型模型研究领域,存在几个关键词。首先是大型模型的幻觉,大家通过更大的模型去减少幻觉,成本会随之上升,毕竟幻觉问题没有止境。其次是大模型本身的时效性较差,大模型是静态的知识库,需要不断升级。尤其是在垂直领域的实际商业应用中,需要解决企业自身的数据、公开网络数据以及垂直领域的数据三大问题。
对于解决这些问题,王小川认为,光靠模型本身做得再大都是不够的,大模型+搜索才能构成完整的技术栈。“当技术增强,我们能实现互联网与垂直领域知识、全网知识的全线链接,这个完整的技术栈有利于我们让大模型真正去落地应用。”
“我们知道做模型的时候,不代表每次效果都会提升,搞不好(会)下降,是不稳定的事情。即便大模型公司也需要非常多的经验积累,才能提升它的效果。”王小川认为,行业大模型大路径,不仅人才、算力要求高,稳定性、可靠性都会低很多,与此同时,一旦数据或者算法更新,企业就得重训一次。“因此用行业大模型解决企业应用,概念大家听着很开心,但今天并没有良好实践,面临很多问题。”
王小川认为,通用大模型可以在大部分场景下替代行业大模型,通用大模型+搜索增强可以解决99%企业知识库的定制化需求。
王小川表示,更大的内存、更强的处理器依然不能解决幻觉问题,也不能解决外部知识引入和时效性的问题。“我们认为需要通过搜索增强把互联网实时的信息和企业完整的知识库,像硬盘一样装进去。让大模型外挂这样一个外部知识,外挂外部硬盘,这是搜索增强做到的工作。有了搜索增强以后,大模型加上外挂硬盘的即插即用,使得在绝大多数领域里面模型变得更加实用。”
谈大模型:业内发展速度超出外界看法
“这次跟上次不一样,上一波由于模型能力,主要是图像处理,因为不够通用,不够通用带来两个问题:首先是大家都挤在一个赛道里,都去做安防,不能赋能千行百业,也不能进一步降低企业的使用成本。其次是赛道很窄,每个项目都很重,今天美国证明大模型在很多行业都可以做,而且实施成本会比原来低很多,所以这一波我觉得是可行的。”谈及这一年的大模型热潮与此前的区别,王小川表示。
回溯今年以来的大模型竞速,王小川将其分为了三个不同阶段。第一个是恐慌期,“有了之后看中国公司还不行,数据飞轮美国先跑起来,是不是通用人工智能要来了,大家有这个探讨。”第二阶段,大家开始火热地工作,所有人的关注都在这里;第三阶段,技术迭代加速,“我们的技术人员每天都要跟进最新的东西,要把自己(的成果)不断迭代不断改进,行业中的发展速度其实超出外界媒体和资本圈的看法,目前还是在快速迭代。”
而在应用领域,王小川认为,今年是中国大模型发展的元年,明年中国各家公司都会有相应的成绩出来。“今年确实大家太需要把精力放在模型本身,应用在今天我认为还是在初期状态,这会儿谈应用早一点,明年会差不多。”
封面图片来源:视觉中国-