一站式图文、视频创作，讯飞星火V2.0多模态能力重磅升级-汇君网

谁说大模型都是冰冷的代码？其实，它也可以塑造“血肉之躯”。在8月15日讯飞星火认知大模型V2.0升级发布会上，我们见识了虚拟主播介绍世外桃源“桃花潭”的美景，也亲眼目睹了虚拟外教与刘聪院长“狂飙”口语的炫酷。而这些应用场景，都源于星火V2.0在多模态能力上的提升，让视频内容生产与英语学习效率大幅提升。

一站式图文、视频创作，讯飞星火V2.0多模态能力重磅升级

中金研报曾指出，如果虚拟角色在大模型等技术助力下，能够实现与用户实时智能互动，用户将获得更具真实感的体验，继而激活一个巨大体量的市场。何况，科大讯飞依托星火多模态技术，率先将其用于视频内容生产。根据中国电子信息产业发展研究院发布的数据，预计2023年中国超高清视频产业规模将达到4万亿。同时视频产业是一条涵盖生产、分发、消费等上下游的长链条产业，仅生产环节的市场规模就从2016年的19亿飙升至2022年的3860.7亿元，年均复合增长率达到222.34%。

基于视频生产环节巨大的商业机会，讯飞星火认知大模型以多模态技术实现“虚拟主播”出镜，不但极大提升了视频内容质感和新颖度，还能化身“景点导游”、”室内导览”以及“银行客服”等身份，在旅游、展览、金融等各行各业发挥巨大价值。据悉，科大讯飞虚拟人服务已在各行各业遍地开花，并与新华社、央视动画、中信银行、中国平安等公司建立了合作，在北京冬奥会、成都大学生运动会等世界性体育赛事，讯飞虚拟人技术都进行了精彩呈现。

一站式图文、视频创作，讯飞星火V2.0多模态能力重磅升级

为了极致简化使用难度，科大讯飞在星火V2.0发布会上，重磅升级了讯飞智作2.0一站式AIGC内容创作平台。用户只要录制一段真人出镜的3-10分钟视频，再将视频放到讯飞智作2.0平台进行训练，即可生成1:1还原的真人虚拟数字分身。同时也可以选择不同风格的配音，让虚拟人具有多情感演绎能力，结合内容本身的喜怒哀乐来控制语气、语调和停顿，让用户看到“有血有肉”的温情演绎。

2023年下半年，当同类大模型还停留在文本“二维”阶段时，讯飞星火认知大模型已进入音画“三维”阶段，实现了AIGC技术在内容生产与各行各业的“智慧涌现”。同时讯飞星火助手中心上线的一千多个智能助手，全方位满足了职场、营销、创作等各类场景需求，助力全方位提升工作效率，降低时间成本。而时间，就是这个时代最宝贵的东西！

如今，大模型正在悄无声息、却又影响深远地改变着人类世界。面向未来，正如讯飞董事长刘庆峰所期盼的那样：“今天讯飞星火2.0发布后，我们还会迎来3.0、4.0，希望到那时你已经成为了我们的伙伴，无论是API的开发伙伴、共建行业生态的伙伴、还是做最终应用的伙伴，相信都将成为在星火赋能之下工作和生活更幸福的伙伴。”

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 3587015498@qq.com 举报，一经查实，本站将立刻删除。本文链接：https://www.xmnhj.com/h/209124.html