新华社研究院发布国产大模型报告:讯飞星火“智商”位列榜首

报告显示,讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。

红网时刻新闻8月13日讯8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》,讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一。

《报告》认为,讯飞星火认知大模型具有7大核心能力,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;在即将到来的8月15日,会在代码能力上实现重大突破,并在多模态交互能力上升级。

课题组分别从常识知识、逻辑能力和专业知识方面对大模型进行考量,结果显示,讯飞星火排名第一。在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效和生成创新方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。

《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。169

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 3587015498@qq.com 举报,一经查实,本站将立刻删除。本文链接:https://www.xmnhj.com/h/204240.html

      
上一篇 2023-08-14
相关推荐
发表回复
登录后才能评论