火爆大模型,落地冷思考

火爆大模型,落地冷思考

爆火的ChatGPT热度还没减, AutoGPT又横空出世。

4月18日,钉钉总裁叶军宣布钉钉正式接入阿里巴巴“通义千问”大模型,并用一根AI魔法棒“/”打开智能化魔法世界。“/”可以生成智能会议纪要并提炼摘要、待办,从海量群聊消息中整理关键信息、形成摘要,通过对话或拍照生成应用等。大模型再一次抢了眼球。

ChatGPT的火爆出圈,引发了人工智能大模型布局和创业大潮,也引爆了整个人工智能产业。那么,这些大模型未来将何去何从,又将给人工智能产业带来怎样的影响呢?

在犀牛财经近日主办的“ChatGPT冲击波下的AIGC发展机遇”沙龙上,与会嘉宾对上述问题进行了深入的探讨。

ChatGPT引领AI应用热潮

正如艾瑞数智人工智能首席分析师王紫萌所言,ChatGPT这一现象级突围产品拉开了大语言模型产业和AIGC产业蓬勃发展的序幕。她认为,相比之前的生成式对话产品,ChatGPT的大范围连续对话能力,使得生成内容质量、语言理解能力、逻辑推理能力和类人的体验等都得到了一个大幅度提升,超出了大众对于一款普通聊天机器人的预期,因此成为AIGC产业发展的一个非常关键的节点,也拉开了大语言模型产业和AIGC产业蓬勃发展的序幕。

北京信息科技大学教授、正高级工程师胡涵清认为,ChatGPT快速发展的背后,是经过多年发展后,人工智能技术实现从感知智能升级到认知智能,引发了机器理解、分析和决策能力的突飞猛进。AIGC是实现认知智能产品化的一个重要方式。

最近新晋的AutoGPT则是一个认知能力更强的产品。AutoGPT由GPT 4驱动,主打全自动。不同于ChatGPT的单次提问、单次回答模式,AutoGPT能够建立一个“思考、行动、观察结果、决定下一步行动、再次行动、再次观察结果”的循环。

胡涵清回顾AI发展历史说,AI发展到现在,经历了很多次寒冬;每次寒冬或者复苏,都出现AI的通用化和专业化的分歧。通用化是代表的是人类对AI应用的美好畅想;而专业化则能够带来更好的落地部署应用。21世纪前20年,是通用化大模型提出并且获得发展的一个时代。这一时代大模型训练与项目任务微调的结合,让模型应用到各种场景中成为可能,从而极大提升模型的通用能力。

回到当前的AI市场。王紫萌认为,ChatGPT被称为AI的“iPhone时刻”,以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为可能,并通过生产工具、对话引擎、个人助理等应用,起到协助人、服务人,甚至超越人的角色。凭借此革命性突破,ChatGPT在搜索引擎与各类工具软件中率先掀起应用热潮,引起了广大用户对ChatGPT相关技术的关注与学习。海量下游应用也因此捕捉到新的技术与产业机会,希望通过各类大模型与工程化能力,将类ChatGPT产品能力输送到原有应用中。一场关于应用的革命序幕就此拉开。

亚信科技AIGC规划专家廉霄兴从产业层面分析说,AIGC代表了内容创作模式上的革新方向,可以提高内容生产的多样性,提供更加动态且可交互的方式,实现传统PGC(专业内容生成)与UGC(用户内容生成)所难以成就的内容广度,同时在速度、成本和可控性上更优。

大模型混战终将大浪淘沙

ChatGPT大火之后,国内各大厂商纷纷在大模型领域抢占阵地。据不完全统计,百度、阿里、360、商汤等至少15家企业都宣布已经启动AI大模型项目。竞争逐渐开始白热化。

那么,谁将在这唱大模型混战中脱颖而出呢?

对于这个问题,胡涵清认为,现在下结论还为时太早。但是他坚信,和手机操作系统中的iOS和安卓一样,以AI大模型为基础的商业生态中,最终真正成功的通用大模型为数不多,而其他更多的厂商将成为存活下来的通用大模型的生态系统组成部分。

从长期来看,多个通用大模型百花齐放显然是不现实的。别的且不说,算力支撑就是个瓶颈。。

胡涵清分析说,算力是个吞金兽,大型语言模型对算力的需求很大,且面临着很大的资源缺口。比如,ChatGPT依赖于英伟达A100显卡,OpenAI训练ChatGPT4用了上万片英伟达A100。4月6日,ChatGPT 还因需求量太大暂停了升级服务,并停止 Plus 付费项目的销售。

值得注意的是,美国还针对A100芯片对我国实施了禁售政策。因此胡涵清认为,我国高端芯片如何实现突围,满足的大语言模型算力需求,也是亟待考虑的一个问题。

传言训练文心一言调用了其几乎所有A100芯片的百度,一直在积极寻求英伟达A100的替代品。其中,网传的一份百度集团交流纪要显示,寒武纪思元590能够在一定程度上代替A100,但在软件适配度、稳定性方面仍显不足。

励算科技砺算科技联合创始人、联席CEO孔德海认为,当前很大程度上算力就是竞争力,但是提供算力的GPU昂贵且短缺。

那么,该怎么来化解这个矛盾呢?孔德海认为,可以从以下四个方面来着手;一是协同化,是指很多运算可以跑在云端,并根据需求进行协同;二是模型小型化,在高质量数据前提下,小型模型可以在单机上运行;三是再训练,在有限条件下,反复训练有助于提升用户体验;四是融合计算。

4月10日刚刚发布“日日新SenseNova”大模型体系的商汤科技在算力中心改造时的思路在一定程度上与孔德海一致。商汤认为,算力不是“堆卡”,还需要做到卡间连接、提速,才能实现高效训练。为此,商汤科技完成了升级机柜、改变算存比例、重新连接计算等一系列动作。

行业化赛道大有可为

以ChatGPT为代表的通用大语言模型引发了全民狂欢,但是在企业级市场,情况却不尽相同。企业级用户追求应用的稳健性、可靠性、可用性、安全性和合规性,从目前的情况来看,通用大语言模型还不能满足这一点。

廉霄兴就认为,直接使用开源模型赋能通信业存在极大不确定性,存在专业任务能力、内容时效与事实性、专业程度不足等问题。

正因为如此,亚信科技选择在通信领域构建通信行业GPT大模型。不久前,亚信科技人工智能实验室联合清华大学智能产业研究院,面向通信行业数智化转型,充分利用行业数据资源和行业Know-How,进行预训练和微调,共同构建通信行业GPT大模型TelcoGPT。

廉霄兴介绍,5G/6G通信与生成式AI已被业界视为一组最新的通用目的技术组合,对垂直行业的发展起到提振生产力与赋能的作用。AIGC 的多模态数据全面理解和生成能力,深度赋能通信业各个层面,推动智能通信网络的演进升级和落地应用。比如说,亚信科技以客户旅程视角,聚合各类AIGC 能力,赋能客户完整的、丰富的,沉浸式业务流程体验。

尽管ChatGPT推出来后,很多人面临着职业危机。哪个职业将会被ChatGPT淘汰成为一时讨论的热点。比如说,蓝色光标上周就宣布,全面用 AI 代替外包,由此广告人成为首批被AI下岗的人群。但与此同时,大预言模型也带来了巨大的创业机会。

胡涵清认为,在算力资源不充足的前提下,创业公司可以作为其他通用大模型的生态伙伴,扎根行业深耕行业大模型。

而这一点正是野心勃勃的大厂们喜闻乐见的,为此他们非常关注生态的建设。阿里和百度都已在建设大模型生态,旨在通过云平台输出模型能力,支撑更多应用生长。

王紫萌表示,未来大模型产业空间非常广,每一层都有机会,特别是行业领域;深耕垂直行业解决方案的厂商,可以通过集成大语言模型来优化自己的对话引擎,从而更好地服务下游应用场景。

在廉霄兴看来,通用大语言模型击穿了原来高壁垒的一些行业,从而催生很多新的创业机会;但是需要注意的是,通用大语言模型日新月异,要时刻关注最新的趋势,尽量避免由这种变化带来的冲击。

关注AIGC技术伦理问题

虽然AIGC带来很多机遇,也带来很多挑战。早在今年2月,马斯克就强调,人工智能是未来人类文明最大的风险之一,其威胁程度超过核技术,需要加强安全监管。

胡涵清从技术角度分析了AIGC带来的三种挑战:

一是AIGC带来的技术伦理问题。胡涵清认为,任何科技都可能带来伦理问题,从学术研究转向产业研究的第一步,是探索如何从技术角度来解决可能的技术伦理问题。AI技术发展具有革命性,AI生成内容具有危险性。比如说,2016年微软在推特上发布了聊天机器人Tay。Tay可以在维特上学习知识并与人互动。但是一天后微软不得不关闭了Tay,因为此时Tay的言论已经涉及种族歧视、性别歧视等问题。现在很多企业都在运用一些技术避免类似事件的发生,如改善数据质量、增加限制性的条件微调模型,但是做到完全避免非常难。因此胡涵清认为,除了技术伦理问题的预防,使用时的及时警告、紧急关停措施等非常必要。

二是AIGC生成物的版权问题。AIGC是机器学习的一种应用,在模型学习阶段会使用大量的数据。目前,业界对训练后的生成物的版权归属问题尚无定论:一种观点认为因为内容是由学习数据集生成的,所以生成物的版权应归数据集所有方;另一种观点认为AIGC的生成过程是完全随机的,没有版权问题;即使有版权,它也属于AIGC的作者或者平台。胡涵清认为,不管是哪一种观点,对原创作者都不利。

三是AIGC带来的欺诈问题。胡涵清分析说,从技术角度来看,AIGC生成内容完全取决于使用者的引导,在安全措施不到位的情况下,AI对恶意的诱导会不加分析或判断,只会根据学习到的信息输出新的内容,因此AIGC可能被人用来恶意造谣生事,或者编出一些不利于社会的新闻。可见,AIGC作为内容生产的一种新的范式,在推动数字经济快速发展的同时,也对国家的相关法律机构及监管治理能力提出了更高的要求。

正因为对伦理和社会责任的担忧,马斯克、图灵奖得主Bengio等千人联合签署了公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统至少6个月。

也正因为如此,国家互联网信息办公室4月11日发布的《生成式人工智能服务管理办法(征求意见稿)》备受关注。《征求意见稿》明确提出,提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。《征求意见稿》对AIGC生成物的版权归属问题进行划分。

正如嘉宾在交流中所言,AIGC刚刚开始,有很多问题需要解决,有很多未知数在等着我们。让我们共同期待新的时代。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 3587015498@qq.com 举报,一经查实,本站将立刻删除。本文链接:https://www.xmnhj.com/h/158304.html

      
上一篇 2023-04-21
下一篇 2023-04-21
相关推荐
发表回复
登录后才能评论