新华社研究院发布国产大模型体验报告讯飞星火智商指数和工具提效指数居首

首页│

更多>

聚焦新闻

1中欧就经贸关系新定位达成...

2《限制快递过度包装要求》...

3超5000家互联网企业集...

4加强城市地下管网建设筑...

5国际油价仍未挣脱"海峡困...

6美国通胀抬头升至三年高位...

7国内航线燃油附加费5日起...

8可再生能源消费有了“硬约...

9农机护航粮食丰收将海量...

10LABUBU新品上线即“...

"区块链退烧！一周前上市公司争相“表白” 一周后纷纷实话实说"

热点新闻

海运费暴涨、“一舱难求”再...

桥水Q1疯狂扫货美股“六巨...

光伏企业竞相布局 0BB技...

A股突发减持潮来了！近20...

图片新闻

集成电路价格看...

集成电路价格看“涨”声起...

A股四大突发！...

A股四大突发！美国加征中...

新规威力显现！...

新规威力显现！8家IPO...

更加有效保护投...

更加有效保护投资者促进...

新闻 > 产经 > 产经

新华社研究院发布国产大模型体验报告讯飞星火智商指数和工具提效指数居首

来源：上海证券报·中国证券网　　作者：孙小程　　发布时间：2023-08-14

摘要：　　上证报中国证券网讯 8月12日，新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》（以下简称《报告》），讯飞星火以总分1013分位列本次国产主流大模型测评榜首位，在四大评测维度中...

　　上证报中国证券网讯 8月12日，新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》（以下简称《报告》），讯飞星火以总分1013分位列本次国产主流大模型测评榜首位，在四大评测维度中的智商指数和工具提效指数两个维度获得第一。《报告》认为，讯飞星火“在工作提效方面优势明显”。

　　《报告》认为，具有7大核心能力（即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力）的讯飞星火认知大模型拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

　　面对国产大模型“涌现”，讯飞星火认知大模型从立项到发布，再到迭代升级，每个节点都紧锣密鼓：5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地；6月9日突破开放式问答，并在数学能力和多轮对话能力上迭代升级；即将到来的8月15日会在代码能力上实现重大突破，并在多模态交互能力上升级；10月24日对标ChatGPT，实现中文超越、英文相当的水平。

　　在智商评估方面，《报告》认为，人类在智商方面仍然具有明显优势。课题组分别从常识知识（20%）、逻辑能力（50%）和专业知识（30%）方面对大模型进行考量，结果显示，讯飞星火排名第一。

　　在工作效率提升方面，《报告》认为，AI对人类提供了有力的支持，AI的处理速度远远超过人类。然而，尽管AI具有高速度和高效率的优势，但在某些复杂和具有创新性的任务中，人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效（50%）和生成创新（50%）方面进行考量，结果显示，讯飞星火以350分排名第一并遥遥领先。

　　《报告》认为，与2023年6月相比，当前中国大模型产品进步显著，但与接受过高等教育的人类相比，大模型在智商、情商等方面还存在一定程度的差距。虽然在不同领域中，AI和人类表现出不同的优劣势，但在整体上，AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响，大模型正在加速走进生活、走进产业。

责任编辑：《每日财讯网》编辑

上一篇：国家卫健委发布全国医药领域腐败问题集中整治工作有关问答

下一篇：金融监管总局：正在研究制定个人税收递延型商业养老保险试点与个人养老金衔接的政策文件

分享到：