首页│
更多>
聚焦新闻
×
新闻 > 产经 > 产经

新华社研究院发布国产大模型体验报告 讯飞星火智商指数和工具提效指数居首

来源:上海证券报·中国证券网  作者:孙小程  发布时间:2023-08-14

摘要:  上证报中国证券网讯 8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中...

  上证报中国证券网讯 8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一。《报告》认为,讯飞星火“在工作提效方面优势明显”。

  《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

  面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。

  在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。

  在工作效率提升方面,《报告》认为,AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。

  《报告》认为,与2023年6月相比,当前中国大模型产品进步显著,但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度的差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。


责任编辑:《每日财讯网》编辑

上一篇:国家卫健委发布全国医药领域腐败问题集中整治工作有关问答

下一篇:金融监管总局:正在研究制定个人税收递延型商业养老保险试点与个人养老金衔接的政策文件

分享到:

〖免责申明〗本文仅代表作者个人观点,其图片及内容版权仅归原所有者所有。如对该内容主张权益请来函或邮件告之,本网将迅速采取措施,否则与之相关的纠纷本网不承担任何责任。

相关文章

评论框

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 密码:

 客服电话:010-57135130 传真:010-57135130 邮箱:mrcxnews@163.com

本站郑重声明:每日财讯网所发布的文章、数据仅供参考,本网不对信息的完整性、及时性负任何责任,投资有风险,选择需谨慎。

Copyright Up to 2022 mrcxnews.com All Rights Reserved. 《中华人民共和国增值电信业务经营许可证》编号:京B2-20171131号 【京ICP备16069224号  

关闭
关闭