本报记者 李晖 北京报道
大模型正在成为推进金融业数字化的第二波浪潮。
在对新技术最敏感也最谨慎的金融业,虽然大模型的渗透仍处于初期,但没有一家机构对其“不关注”,一些大厂(大型互联网公司)甚至一度“门庭若市”。近半年来,银行、券商、保险等传统金融机构,以及金融科技公司、隐私计算类公司纷纷下场。
“今年4月我们银行领导计划拜访主要科技公司,一接触发现竟然‘需要排队’,很多大型银行、头部股份制银行是董事长、行长级别带队去调研。”一位国有大型银行技术高管向《中国经营报》记者透露。
值得注意的是,大模型除了进一步提升金融行业数字化水平之外,是否能带来质变层面的利好尚需时间检验。中国工程院院士、复旦大学金融科技研究院院长柴洪峰在今年7月的一场公开演讲中指出,从技术面看,金融数据和知识的私密性限制了共享和构建大规模数据集的能力,金融数据的多模态特性增加了模型处理和建模的复杂性。
记者采访的多位从业者认为,大模型是金融行业“必争之地”,但仍要面对技术挑战和行业特点限制。想进一步渗透到风控等金融核心业务,还需要在垂直领域精调,并经过相对完整信贷周期证明。
“塔尖技术”浪卷金融业
大模型是“大规模预训练模型”的简称,主要依据参数规模(即函数的参数数量)来定义,相对于基础深度学习的“小模型”,通常参数规模多于10亿的模型被称作“大模型”。
科技部下属相关单位发布的《中国人工智能大模型地图研究报告》显示,截至2023年5月末,全国参数在10亿规模以上的大模型已发布79个,数量仅次于美国排名全球第二。
腾讯研究院今年7月末的一项调研数据显示,国内参数在10亿规模以上的大模型数量已由5月末的79个增加至116个,其中金融行业大模型约18个。
从公开信息看,5月,大数据基础软件供应商星环科技(86.820, -4.19, -4.60%)推出面向金融量化领域的生成式大语言模型“无涯Infinity”;5月下旬,度小满推出国内首个千亿级中文金融大模型“轩辕”;6月底,恒生电子(36.170, 0.17, 0.47%)推出金融行业大模型“LightGPT”;同期,拓尔思(20.110, -0.45, -2.19%)发布包括金融行业大模型在内的产品;8月底,马上消费金融发布了首个零售金融大模型“天镜”。
据记者了解,自然语言处理(NLP)、机器学习(ML)、计算机视觉(CV)、智能机器人(12.780, -0.07, -0.54%)(IR)等是人工智能应用最广的几个子领域。
在北京大学光华管理学院商务统计与经济计量系教授王汉生看来,算力、算法、数据构成了新范式的“三驾马车”,好的人工智能算法、模型最终要解决的是业务问题,数据模型落地最重要的是寻找应用场景。
而围绕NLP的大模型则决定了其在金融业务中的主要应用范围。从第一批披露“大模型”相关动作的金融机构来看,应用探索多集中在智能投顾、智能客服、营销渠道、保险理赔、研报撰写等业务场景。
前述国有大型银行技术高管提供的场景列表显示,该行自研的大模型目前已经应用在在线客服辅助、智能知识辅助、法律事务问答、运维知识问答、辅助分析财报、网络安全辅助分析、智能辅助公文生成等场景。从效果来看,智能客服可以持续提升问答结果准确率。
“从行业应用路径来看,科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域训练,然后做私有化的部署和应用。”度小满CTO许冬亮表示。
根据度小满官方信息,其中文金融大模型“轩辕”开源以来已经有上百家金融机构申请试用。度小满数据智能部总经理杨青透露,“轩辕”大模型2.0版本将在今年10月发布,将会进一步提高对话和金融理解等场景下的能力,实现处理更长的金融报告、研究和分析。
除度小满之外,奇富科技在2023年二季度财报中披露:通过对预训练的深度学习模型和大语言模型进行调优,使得在用户身份识别和行业识别场景下,模型理解能力提高。腾讯云在今年7月披露,其已经推出金融风控大模型。数据显示,应用后客户风控策略部署效率提升10倍。而马上消费金融也在近期发布“天镜大模型”时透露,该模型将应用于营销获客、风险审批、客户运营、客户服务、安全合规、资产管理六个零售金融最典型的场景。
核心业务有待渗透
从制约因素来看,任何AI 大模型都面临着算力需求大、训练和推理成本高、数据质量不佳、隐私和安全问题等挑战。而由于金融行业面对的监管门槛更高,对大模型在数据合规性、可追溯性、私有化部署、风险控制等方面就提出了更多要求。
据记者了解,大模型主要有两个方面需要改造,一是高达上千亿的模型参数,需要算力支持和高可扩展的调度框架;二是巨量的高质量语料训练。而仅在第一个方面,就需要数以亿元级别的投入。
“算力的成本也决定了小机构很难负担,2023年3月我们发现AI服务器市场出现几倍增长。比较幸运的是我们今年年初囤了不少卡(CPU),这也是我们在大模型风起时能够快速跟进的基础。”一家金融科技公司内部人士向记者表示。
而在数据安全方面,前述国有大型银行技术高管透露,银行的大模型业务主要基于开源数据,以及行内已有的数据进行清洗。这要求AI首先要懂本行知识,要支持多轮对话,还要能实现知识更新并对齐人类思维。而如果是引入外部合作方,必须都部署在银行本地。
在金融这种专业门槛极高的领域,所需的“巨量语料”显然不是互联网免费公开的数据,要训练出精度极高的模型,需要的是极其准确专业的知识,甚至是核心付费数据。大模型的幻觉问题(AI“一本正经地胡说八道”)在金融领域更是无法容忍的弱点。
业界倾向认同:通用的大模型往往只能解决80%的问题,而在面向行业细分领域时,还需要结合信贷传统模型在深度学习领域的积累。
马上消费首席信息官蒋宁认为,通用大模型和金融大模型存在本质区别。目前,大模型还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信,以及基础设施的能力四大难题。“生成式模型不能做解释,但是金融大模型最主要的模型叫作判别性,它需要做决策,包括交易决策。”
事实上,当前银行广泛使用的“大数据”风控模型也是伴随互联网贷款业务的发展,历经五年时间,逐步由形式风控走到实质风控,由联合风控走到独立风控,由内部质疑走到广泛接受。从这一逻辑来看,“大模型”显然也需要经过数据的积累周期、完整的信贷周期、市场的接受周期等过程,才可能真正放心地投入到银行信贷的核心环节。
“大模型在金融行业的落地路径需要通过大数据的整合、大算力的合作,在垂直领域精调模型,以小规模算力打造轻量级推理模型。”在光大信托数据公司总经理祝世虎看来,目前大模型在金融领域的应用主要集中在智能客服、智能运营、智能办公等领域,后续应该更多地应用于风险管理、资本管理和监管科技等方向,且对于传统风控难以捕捉的、由小尺度风险传导至大尺度风险的风险刻画,也可能是大模型的优势之一。
“但需要注意,大模型是社会整体生产力级别的提升,会产生‘双刃剑’的效果,即机构在风控、反诈领域性能提升,而黑产、诈骗团伙等也可能会使用这些能力,攻防双方未来可能会在更高科技维度上去对峙。”祝世虎向记者进一步表示。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 3587015498@qq.com 举报,一经查实,本站将立刻删除。本文链接:https://www.xmnhj.com/h/218544.html