新华社研究院中国企业发展研究中心昨日发布了《人工智能大模型体验报告2.0》(下称《报告》)。

《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距。

《报告》选取360智脑、百度文心一言、澜舟Mchat、商汤商量、讯飞星火、阿里通义千问、昆仑天工、智谱ChatGLM共8种大模型产品进行评测,根据基础能力、智商能力、情商能力、工具提取四个维度计算总分。附总分排名如下:


(资料图片)

讯飞星火:1013分

百度文心一言:1010分

商汤商量:983分

智谱ChatGLM:983分

360智脑:951分

昆仑万维天工:943分

阿里通义千问:935分

澜舟Mchat:932分

据介绍,讯飞星火“在工作提效方面优势明显”,百度文心一言“地基深厚、基础能力仍处领军水准”,商汤商量则“在情商方面表现优秀”,智谱AI的ChatGLM整体表现优秀。

同时,AI技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展,AI大规模落地需要更多时间来验证。

《报告》原文:点此查看。

推荐内容