蚂蚁金融大模型发布！AI助手在支付宝里帮你诊行情、做投研，未来业务将全线接入

传闻中的“蚂蚁大模型”，这次真的来了！

今年6月，就有传闻蚂蚁集团正在自研多模态大模型。而就在9月8日的上海外滩大会上，蚂蚁集团副总裁、蚂蚁金融大模型负责人王晓航正式发布蚂蚁金融大模型，并喊出“1+1+2”的大模型战略矩阵。

来源：蚂蚁官方

蚂蚁金融大模型是基于蚂蚁自研的基础大模型上打造，其底层算力集群达到万卡规模。目前已在蚂蚁集团的财富、保险平台上全面开启内测。

当天，蚂蚁集团还同时发布了基于金融大模型能力的两款产品：智能金融助理支小宝2.0和智能业务助手支小助1.0。后续面向C端用户的支小宝2.0，通过“支付宝”就可上手玩。

另外，还推出一款金融专属任务评测集Fin-Eval，从五大维度28个分类进行评估，当前测评集已开放可用。

来源：蚂蚁官方

千亿级Token金融知识，还有专业测评集

“因为大模型的幻觉问题，只有确保模型拥有领域知识和专业逻辑的严谨性，才能真正赋能金融服务”，蚂蚁集团副总裁、金融大模型负责人王晓航表示。

因此，基于金融场景中的大量实践，蚂蚁金融大模型以“大模型+知识+服务”为驱动的架构方式，来让大模型“说真话”。

据介绍，蚂蚁金融大模型拥有1万亿Token优质通用语料，目前被誉为全球最强开源大模型的Llama 2语料也不过2万亿。另外，还有5000亿Token全网金融语料，并从300+真实产业场景中提取了60万+高质量指令数据，目的就是打造一个金融行业的专家模型。

对于内容生成的安全可控问题，团队选择采用意图识别与事实性校验相结合的方式来解决。

来源：蚂蚁官方

知识面很广，具体能力怎么样？蚂蚁也有一套自己的测评方法。

为了系统化评估AI在金融领域的表现，蚂蚁从真实金融场景定义了金融AI任务评测集“ Fin-Eval”，数据集由“认知、生成、领域知识、金融逻辑、安全合规”五大维度共28个分类组成。

经过一系列的系统测试，目前大模型已率先在理财和保险领域进行应用测试，并成功通过了“证券从业资格、保险从业资格、执业医师资格、执业药师资格”等在内的专业试题测试。

智能助手上线，保险理赔都拿捏

当天，蚂蚁集团也发布了首个基于金融大模型的应用产品——智能金融助理“支小宝2.0”，以及面向金融行业专家的智能业务助手 “支小助1.0”。

来源：蚂蚁官方

具体来说，“支小宝2.0”就是一款主要面向个人用户的智能金融助理，可为用户提供“行情分析、持仓诊断、资产配置和投教陪伴”等专业服务。经过团队测试，“支小宝2.0”已具备高精度的意图理解，金融意图识别准确率高达95%，金融事件分析推理能力已完全不逊于真人行业专家。

“支小助1.0”则是一款面向大企业的智能业务助理，针对不同金融场景的从业人员，蚂蚁分别推出“服务专家版”、“投研专家版”、“理赔专家版”、“保险研究专家版”等六个版本。

以“投研支小助”为例，实测数据显示，支小助每日能够帮助每位投研分析师高效完成100篇研报和资讯的金融逻辑和观点提取，以及40多个金融事件的推理和归因，可大幅度提升分析效率。

此外，支小助1.0还能基本替代基础的金融工程代码编写，显著提高了量化研究效率。

目前，“支小宝2.0”已内测半年时间，待完成备案即可上线开放，“支小助1.0”则正与蚂蚁平台的合作机构开展内测中。

未来，蚂蚁集团将持续探索和精进大模型的五大能力方向，集团与金融机构合作的所有数字金融业务也将全线接入大模型。