国内首个官方大模型评测结果出炉 四款国产大模型通过
时间:2023-12-23 11:30:39 小新新
【新闻】近日,国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测,代表着其在通用性、智能性等维度均达到
【新闻】近日,国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测,代表着其在通用性、智能性等维度均达到国家相关标准要求。
根据公开资料,上述四家企业拥有的大模型分别为通义千问、文心一言、360智脑、混元大模型,其中通义千问是唯一的开源模型。
据了解,“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。
据阿里方面介绍,通义千问是本次通过的首次大模型中唯一的开源模型,通义千问 72B 号称自 12 月 1 日开源后,先后登顶 HuggingFace 排行榜、上海人工智能实验室 Open Compass 榜单。
据腾讯方面介绍,腾讯混元大模型符合《人工智能大规模与训练模型 第 2 部分:测评指标与方法》语言大模型的相关技术要求。该模型号称拥有超千亿参数规模、预训练语料超 2 万亿 tokens。