面壁智能MiniCPM发布 为端侧大模型发展按下加速键
【】2023年科技圈的年度热词无疑有大模型一席之地,到了2024年,它的热度依然没有衰减。2月1日,面壁智能的端侧大模型面壁MiniCPM正式亮相。
半年来,端侧模型发展迅速,面壁智能在这个时间节点推出面壁MiniCPM端侧大模型,究竟有什么优势呢?答案是,性能方面的绝对领先。回顾2023年,Mistral-7B模型在行业里面获得了很多的赞誉,甚至被称为欧洲的OpenAI。而面壁MiniCPM,凭借2B规模IT精选数据,在多项主流评测榜单中,中英文平均成绩均超越Mistral-7B。此外,面壁MiniCPM的性能还与微软的Phi-2、GPT-4等大模型比肩,甚至在某些方面有所超越。尤其在20B、40B、54B规模的模型中,面壁MiniCPM的表现也相当出色,英文榜单的平均分显著领先。
面壁MiniCPM的强大性能,使其在用户中备受好评。据官方数据显示,在MiniCPM榜单上,该模型取得了优异的成绩,并收获了众多用户正向评价。这得益于面壁MiniCPM强大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测的闭环牵引模型版本快速迭代。
为了方便用户更低成本的使用,面壁MiniCPM还发布了端侧版本名为MiniCPM-V,根据官方介绍,其在手机端的推理速度每秒大概7个Tokens。此外,因为其拥有模型小的优势,用户只需要1台机器或者一张显卡就能持续训练其能力。对此面壁智能也在发布会上进行了展示,不同终端设备的吞吐量各有不同,也正是壁MiniCPM的出现,让用户那怕是一部手机,一个消费级显卡也能在端侧流畅跑通大模型。为了更真实的展示面壁MiniCPM在端侧的处理能力,发布现场,面壁智能联合创始人、CEO李大海还使用一台OPPO Find N3现场演示了端侧(飞行模式无网络)运行效果,文本处理速度很快,吞吐(tokens/s)达到了6.5。
此外,为了推动大模型技术走向普及,面壁智能在发布会上宣布,将面壁首款大模型ChiensePre-trainedModel首个10亿级别中文开源模型。此外,面壁智能还将调试过程中的实验结果和数据配比公式公开,以促进行业共同发展。
发布会最后,面壁智能为广大用户准备了一个新年彩蛋,推出了一款名为“心间”的APP。用户可以申请试用,并体验内置的“磕CP”功能,体验由大模型推理创作的独特CP。这款APP不仅丰富了用户体验,也进一步展示了面壁MiniCPM在大模型领域的强大实力。
在人工智能技术日新月异的当下,大模型技术正在改变我们的生活,面壁MiniCPM的亮相,无疑为我国人工智能发展注入了新的活力。随着技术的不断进步,我们有理由相信,大模型技术将在未来发挥更大的作用,为广大用户带来更多便捷与惊喜。