2023-10-25 12:38:21 快讯
目前,大模型在金融领域的应用已初具规模。当下,积极创新大模型技术,加快推动大模型与与金融行业整合发展,是助力大模型落地金融各大场景的主要研究方向。度小满一直以来不断创新大模型技术,提升自身在大模型等前沿技术领域的技术实力。在百度世界·度小满金融大模型前沿发展论坛上,度小满CEO朱光表示:未来五年,生成式AI将成为度小满在金融领域的主攻方向。
度小满不断加大金融垂类大模型及应用布局
10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”
中国工程院院士邬贺铨发表主题演讲
邬贺铨指出,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。
以度小满的开源金融大模型“轩辕”为例,它是将预训练数据(一般预训练、金融预训练)和指令数据(一般指令、金融指令)随机混洗到一个训练数据中进行混合微调,通过多阶段逐渐训练缓解预训练和微调间数据不匹配问题,提高模型的表达、理解、迁移和泛化能力。
度小满CEO朱光表示,“未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。度小满将不断加大金融垂类大模型及应用的布局和投入,和业界一起把握机遇,推动新一轮金融科技发展浪潮。”
金融大模型的发展仍面临三方面挑战
邬贺铨认为,金融大模型的发展目前仍面临着三方面挑战。首先是金融行业对数据安全性、隐私合规性都有着严格的要求。尤其是在风控方面,对时效性与精准性要求严格,而一般的基础大模型透明性、可信性、专业性不足,很难直接迁移为金融大模型。
第二点是金融大数据在成本与质量上的平衡问题。由于金融行业内的数据难以共享,因此金融大模型的数据规模远远不及通用语料,导致金融大模型难以产生“智能涌现”的效果。
第三则是本地私有部署需要自建算力设施,对软硬件产品有严格的信创要求,而且参数规模大则算力成本高。
对于金融大模型的落地应用途径,邬贺铨院士建议:一是从可控入手开发应用,例如智能客服、智能运营、写文章、写邮件等安全的领域出发。二是从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。也可以在金融大模型训练或微调时通过有监督学习思维链的模式,通过专家介入引导它一步一步地进行思维推理。
中国工程院院士邬贺铨(左)与度小满CEO朱光(右)交流
从开源金融大模型“轩辕”开始,度小满持续加强对前沿技术的研究力度,积极攻克技术难题,推动生成式AI在金融领域落地。未来,度小满将继续聚焦金融大模型,不断创新大模型在金融领域的应用与落地途径,借助前沿科技提高对金融数据的理解与应用能力。