新物网

当前位置:首页 > 科技

科技

国产手机大型号第一战:买大型号基地,争夺硬件和生态

时间:2024-01-11 09:21:40
端侧大模型的天花板目前主要体现在对手机运行内存的压力上,这是当前阶段手机厂商普遍只选择旗舰手机测试端侧大模型的直接原因。但手机硬件厂商也有自己的优势:用大模型能力,让手机现有硬件第一方能力再进一步,几乎是目前所有玩家的共同选择。

国产手机大型号第一战:买大型号基地,争夺硬件和生态

智能助手的概念从诞生之日起就与人类对AI的想象密不可分。 Siri最初作为独立助手使用,于2010年2月发布。后来苹果于2011年4月收购了Siri,并将其集成到4S中。

自此,Siri 成为苹果设备的标准功能。 语音助手已经逐渐成为智能手机的标配功能。

随着大机型成为时代主流,人类再次看到了让手机像人类一样智能的一线希望。 2023年下半年开始,小米、OPPO、vivo等手机厂商纷纷宣布入局,组建团队,并在新体系中加入大机型能力:在连续几年市场体量萎缩之后,手机厂商已经他们把希望寄托在AI身上。 该模式可以成为未来五年甚至更长时间内持续吸引用户更换手机的增长点。

大机型出现在手机上确实成为了2023年手机行业最热门的话题:到2024年1月,国内排名前5的手机公司除苹果外都发布了自己的端侧大机型产品。

从没人关注到赛道上挤满了人,只用了半年的时间。 随着手机厂商在发布会上展示的融合常见应用场景,包括自动生成通话记录、AI图像处理等,现在没有人怀疑大机型在手机上的应用前景。

但我们离像人一样智能的终端侧大机型手机还有多远?

自研大模型真伪的困惑

团队的组建规模往往可以说明很多问题:小米已经组建了3000多人的AI团队,而Vivo已经拥有数千人的团队从事生成式AI领域的产品开发。

尽管已经组建了大规模研发团队,但围绕AI大机型产品自研的争议却从未消失:手机厂商在发布大端端机型产品时,会花大量篇幅介绍他们对人工智能领域的长期投资。 但这实际上混淆了语音助手背后的大模型的本质。

大机型的实际供应商无疑是手机厂商的秘密,但从手机厂商在生成式AI领域的投入步伐中还是能看出一些端倪。

据相关厂商内部人士透露,vivo目前的大号机型是在智浦AI的基础机型上进行改进的。 小米本身也是智普AI的股东,并于2023年10月参与了智普AI的投资; 今年4月的阿里云峰会上,阿里云正式发布的“企业专属大机型”合作名单中,OPPO名列第一。

这位业内人士还向记者透露:手机厂商花费数千万投资采购基础模型,让作为语音助手呈现给普通用户的大型模型产品最终能够适应硬件的结构,并提供以上的传递性。标准。 大型模型体验。

对于这些厂商来说,目前自主研发的大模型目前无法满足用户对大模型能力的需求,因此主要的选择是从市场上购买现成的预训练模型,并在此基础上进行调整。 再加上发布时的营销手段,购买的预训练模型不经意间就变成了“自研”。

另外,由于现行《生成大机型管理服务暂行办法》带来的监管白名单制度的存在,手机厂商想要赶上这波热潮,购买现有的大基数机型并进行微调他们基于他们。 之前的“自研”是针对当前形势的短期快速解决方案,而“抢先上市”则是为数不多的选择之一。

但在注定是一场马拉松的终端侧大机型竞争中,这种先发优势能保留到什么程度,值得怀疑。

硬件的天花板在哪里?

目前手机厂商公布的多模态大型号解决方案中,大端侧型号均处于各尺寸中的最低水平,参数数量往往仅占前百分之一。 实际的运行结果自然是不同的。

不过,客户端大模型的价值是毋庸置疑的。 就是为了解决云大模型诞生以来就存在的各种问题。 用户对云服务器的每一次请求都会产生一定的成本,这也是从根本上解决用户数据隐私问题的。 方法。

大模型技术的快速进步不仅方便了我们的生活,也带来了前所未有的隐私暴露风险:斯坦福大学的一组研究人员最近发布了一个使用 10 万个随机位置和 50 万张街景图像训练的大模型。 它可以从照片信息中快速识别拍摄者当前所在位置,准确率高达92%。

目前不同手机厂商的策略略有不同,但设备端大机型是任何厂商都无法回避的必选:完全运行在设备端的大机型未来将变得更加重要。

解决了技术路线问题后,剩下的主要问题变成了硬件:70亿参数级别目前是“甜点级别”关键节点,70亿参数大模型的正常模型大小约为28GB。 为了真正部署在设备端,压缩轻量化模型现在可以压缩到3.9GB左右,无论是存储还是内存使用。

不过,在减小模型尺寸和提高运行性能方面仍有很大的改进空间:目前开发人员甚至可以在 2004 年发布的诺基亚 9500 的硬件上运行具有 70 亿个参数的大型本地模型。

A AI:2004 年诺基亚 9500 上的 7B 大型型号

一方面,这反映出过去一年来设备上的大规模模型以惊人的速度开发和迭代。 另一方面,专门为AI设计的硬件可以大大提高当前水平的大型AI模型的运行速度上限。 如今,一系列配备TPU的处理器已经在离线环境下实现了每秒20个令牌的处理速度。 相比之下,桌面版Air M2每秒仅5个令牌。

移动端实现了超越桌面端的令牌处理速度。 这是因为从硬件设计之初就考虑到了深度学习:例如与三星联合定制的系列SoC就集成了人工智能加速器的专用集成电路(ASIC)。 这使其拥有相对于其他厂商的巨大优势:这种优势不仅会体现在2023年大端侧车型的推出浪潮中,而且在后续的竞争中也会更加明显。

高通通过多年的布局,在硬件方面也形成了类似的生态系统。 新发布的高通骁龙8 Gen 3 SoC芯片已经在设备端支持百亿参数(10B)级大型模型的离线运行,并且已经展示了在手机端运行的能力。

大端机型的天花板目前主要体现在手机运行内存的压力上。 这也是现阶段手机厂商普遍只选择旗舰手机来测试大型端到端机型的直接原因。 因此,除了硬件的专门设计之外,模型本身的性能优化还依赖于模型的迭代,这需要云计算业务提供的海量算力的支持。

大规模客户端模式强调的“利用手机闲置算力保证用户数据安全”的前景似乎很诱人,但现阶段还不是一个能够支撑足够用户体验的解决方案。 它的定位更像是现阶段的大规模云模式。 的补充。 随着端侧大模型能力的增强,很快就会看到新的变化。

无论是华为谷歌,还是尚未入局的苹果,过去的芯片设计都已经适配了针对AI的专用算力,尤其是已经问世数年的NPU,直接决定了终端的智能程度。端AI。 其中,谷歌华为针对自研芯片中的AI算力进行了大量的能效优化,这直接考验着手机厂商对硬件的掌控能力。

生态挑战

基于现有语音助手形态,集成端/云大模型交互入口,是目前移动AI大模型交互门槛最低、相对实现效果最好的。

门槛低也意味着更多强劲竞争对手的涌入:几乎没有人愿意放弃接手手机智能助手的可能。 据悉,在最近的更新中,增加了在桌面上工作的功能,允许用户将手机设置为默认语音助手,并直接调用-4的语音交互功能。

但手机硬件厂商也有自己的优势:利用大模型能力进一步提升现有手机硬件的第一方能力是目前几乎所有玩家的共同选择。

去年11月,首次向公众发布时,为了更好地展示其在设备端的应用场景,集成了内置录音机App和14的英文输入法。 更快地将录制的语音转换为文本并提高准确性。

相关阅读:《新发布的AI模型,这些特性值得关注》

在国内手机厂商目前发布的版本中,端侧模型应用在本地图像识别、处理、通话录音等领域也展现出了惊人的能力,因为这些概念对于手机厂商来说并不陌生,而之前的概念AI模式广为人知,AI和深度学习技术在手机端已经有很多应用场景:从手机计算摄影到后台内存调度,再到桌面交互动画,都有AI技术的影子。

但更富有想象力的应用场景还是第三方应用生态:智能语音助手本身就具备打通应用层面的“捷径”功能,帮助直接接入特定功能,比如打通日历、支付、票务等预订应用帮助用户一键预订高铁/机票。 然而,这样的梦幻场景对于大型端到端模型来说似乎触手可及,但实现起来还存在更多障碍。

长期以来,手机厂商都深知用户不知道如何使用语言助手的事实:OPPO发布Andes GPT后,OPPO首席产品官刘作虎表示“不做大机型的手机公司将会破产。” 他在接受媒体采访时表示,“真正使用智能助手的用户并不多”。

语音助手长期以来“低能”的现实,让即使是在AI领域投入多年的智能手机厂商也有意无意地忽视了构建生态系统的重要性。 开发生态系统的投入远远落后于硬件和生成式人工智能产业的发展。 尽管小米华为、vivo、OPPO相继发布了开发者适配2023年大规模终端侧机型的开发规范,但如何将更多的应用服务快速融入到自己的生态系统中,仍然缺乏有效的解决方案。

像妙芽相机这样的独立生成式AI应用的流行,也正在鼓励更多的第三方应用甚至独立开发者加入到手机大机型的竞争中来。 然而,这更多的是“互相争斗”,并没有足够的好处。 在手机厂商的推动下,手机厂商很难将这些第三方App高效地集成到自己的大机型产品中。

“事实上,正是因为大机型具备真正颠覆体验的潜力,多年来存在的深层次问题才暴露出来。”一位手机大机型产品经理告诉记者。

为了解决这个问题,移动操作系统中的通用接口就像“万能胶”一样,将像未来大模型生态系统中的“基础设施”:随着14的发布,API也得到了集成。 ,允许开发者自由调整他们的应用程序以调用本地功能。 未来将会发布更多适用于所有大型端侧机型的通用API开发接口。

不过,此类更新很大程度上依赖于官方的更新速度。 “行业内缺乏统一的开发接口将成为未来的必然事件。因此,拥有硬件和生态系统的厂商将拥有更明显的后发优势。” 这就是大模型产品经理对于未来端侧大模型生态状态的看法。

归根结底,大机型的概念最终会在手机上落地,与应用生态的深度融合几乎是必然的。 生成式AI能够在多大程度上真正接管手机的日常使用也取决于此。 这将是位于生态链下游的手机厂商和开发商竞争与合作的新战场。

现在判断谁是赢家还为时过早,但手机无疑是最适合大机型成长的终端设备之一。 大家期待的终端侧大模型将带来下一个“时刻”,更有可能的是最终拥有完整的大模型开发能力和芯片设计能力。 它诞生于具有制造能力和生态吸引力的制造商之中。

第一轮手机厂商大规模的终端侧模型已经结束。 手机终端侧的大型机型已经走到了前列,但真正的领头羊还没有出现。 只有当大的AI模型真正成为智能手机的“质变”时,用户自然愿意为更好的体验付费。

本文来自微信公众号“电厂”(ID:-),作者:张永毅,编辑:高玉蕾,36氪经授权发布。