上证报中国证券网讯12月23日,百川智能发布全链路领域增强大模型Baichuan4-Finance。据介绍,在高质量金融数据的基础上,通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。
作为金融领域最新的评测体系,FLAME由两个方向的评测基准组成。其中,FLAME-Cer主要面向模型的专业金融能力评测,覆盖了CPA、CFA、FRM等14类权威金融资格认证;FLAME-Sce则侧重模型的场景应用能力,包含10个一级核心金融业务场景,21个二级细分金融业务场景,近百个三级金融应用任务。
FLAME-Cer评测结果显示,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。
在FLAME-Sce评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,其金融数据计算、金融知识理论等场景的可用率更是超过90%。此外,在国内主流开源金融评测基准FinanceIQ上,Baichuan4-Finance同样超越了GPT-4o和XuanYuan3-70B,整体准确率达到79.23%,领先GPT-4o近13%。
在实际应用上,Baichuan4-Finance能够在效率提升、风控合规、客服、决策支持等诸多层面为金融行业带来全方位的价值提升。例如,它能够帮助金融从业者处理文档审核、客户咨询、产品营销等大量日常工作,还能依托深厚的金融专业知识和法律法规理解能力,为机构提供精准的风险识别和合规保障。
目前百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作。