蚂蚁集团的基础大模型配备了万卡AI集群，训练效率处于行业领先地位

AI行业资讯 1年前 (2023) AI导航网

蚂蚁集团宣布在外滩大会上发布了金融大模型，并开源了生成式AI编程平台CodeFuse。蚂蚁集团首席技术官兼平台技术事业群总裁何征宇在接受采访时介绍，蚂蚁大模型采用纯自研技术路线，以全栈布局和长线发展为原则，旨在创造产业价值。为此，蚂蚁集中资源投入大模型底层基础设施的建设，目前已建成万卡AI集群，其训练效率领先行业，为大模型产业化应用提供有力支撑。

何征宇介绍说，蚂蚁一直致力于核心技术的自主创新，于2022年底正式启动大模型研发项目，目前已经形成了基础大模型、行业大模型以及产业应用的全栈布局。

此次发布的蚂蚁金融大模型是基于蚂蚁基础大模型进行深度定制开发的。何征宇介绍称，蚂蚁基础大模型平台拥有万卡异构集群，其中千卡规模训练的多任务学习MFU（Memory First-Use）占比可达40%，集群的有效训练时长占比超过90%。相比于业界方案，RLHF（Relegation Logging Hierarchical Fault）训练在相同模型效果下吞吐性能提升了3.59倍，推理性能提升了约2倍，处于业界领先水平。

何征宇表示，未来蚂蚁将不断探索和提升大模型的五大能力方向。这包括：建设高质量数据标注团队，构建高质量数据体系；攻克基础大模型算法和高效绿色工程能力，提升模型逻辑推理等能力；从通用语言大模型发展到通用多模态大模型，从一般通识走向全面专业；建立有效的大模型评测标准和评测体系，加快大模型的迭代速度；以及构建大模型的安全能力，确保其健康可持续发展。

在产业应用方面，蚂蚁将结合自身能力优势和大模型技术特点，重点探索金融、民生和科技服务等领域的实际应用场景。