国产GPU立功，蚂蚁集团有大消息公布

2025年03月24日 17:23:20 来自北京

近日，蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示，蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版（Ling-Lite）与百灵增强版（Ling-Plus），前者参数规模为168亿（激活参数27.5亿），Plus基座模型参数规模高达2900亿（激活参数288亿），两者性能均达到行业领先水平。

除了自研性能领先的大模型以外，该技术论文最大的突破在于提出了一系列创新方法，以提升资源受限环境下AI开发的效率与可及性。实验表明，其3000亿参数的MoE（混合专家）大模型可在使用国产GPU的低性能设备上完成高效训练，性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

目前，蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要：无需高级GPU即可扩展3000亿参数混合专家LING大模型》已发表在预印版Arxiv平台上。

CFF20LXzkOzZCCzIp7Bn845YxjJI8lQiccZ7fGfVNSjEPA48qiaSQcaYYhsM5fmSicYUl10Gt4g28GzQib5zD8D4BQ.png

此前，DeepSeek通过一系列算法创新及工程优化，使用性能较低的英伟达H800训练出了性能与顶尖模型相当的V3与R1，为大模型的训练开辟了新的道路，让更多的企业和研究机构看到了降低成本、提高效率的可能性。如果蚂蚁集团的技术成果得到验证及推广，意味着国产大模型能够寻找成本更低、效率更高的国产芯片或其他替代方案，以进一步降低对英伟达芯片的依赖。

根据国泰君安证券研报，AI芯片主要分为三种类型：通用型（GPU）、半定制型（FPGA）、定制型（ASIC）。三类芯片代表分别有英伟达（NVIDIA）的GPU、赛灵思的FPGA和Google的TPU（一种专门为机器学习任务设计的AI ASIC）。GPU的计算能力最强，但是成本高、功耗高；FPGA可编程，最灵活，但是计算能力不强；ASIC体积小、功耗低，适合量产，但是研发时间长，且不可编辑，前期投入成本高，带来一定的技术风险。

目前，国内GPU厂商代表有壁仞科技、天智数芯、摩尔线程和沐曦等；AI ASIC厂商代表有华为海思昇腾、寒武纪、燧原股份等。

2024年8月以来，国内AI算力厂商陆续启动IPO辅导。2024年8月26日，AI ASIC领域代表厂商燧原科技启动IPO辅导；GPGPU领域代表厂商壁仞科技于9月11日启动IPO辅导；11月12日，GPU厂商摩尔线程启动IPO辅导。

进入2025年，1月15日，沐曦股份也启动了上市辅导。若四家全部上市成功，将大幅扩展A股AI算力厂商投资标的的供给。

这几家接受IPO辅导的企业中，燧原科技创始团队有AMD背景，其创始人兼COO张亚林于2008年加入AMD，历任资深芯片经理、技术总监。曾经作为全球芯片研发主要负责人之一，在AMD上海研发中心成功领导开发并量产了多颗世界级芯片，拥有丰富的工程和产品化实战经验。

沐曦股份创始团队同样来自AMD，其创始人陈维良曾任AMD全球GPGPU设计总负责人；两位CTO（首席技术官）均为前AMD首席科学家，目前分别负责公司软硬件架构。

而摩尔线程创始团队来自全球GPU巨头英伟达，其创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理，在GPU这一行业已经深耕近二十年。

除了这四家接受IPO辅导的厂商外，天数智芯、昆仑芯、平头哥等厂商也广受市场关注。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

[责任编辑：谢伟 PF123]

推荐4