近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业领先水平。
除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE(混合专家)大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。
目前,蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已发表在预印版Arxiv平台上。
此前,DeepSeek通过一系列算法创新及工程优化,使用性能较低的英伟达H800训练出了性能与顶尖模型相当的V3与R1,为大模型的训练开辟了新的道路,让更多的企业和研究机构看到了降低成本、提高效率的可能性。如果蚂蚁集团的技术成果得到验证及推广,意味着国产大模型能够寻找成本更低、效率更高的国产芯片或其他替代方案,以进一步降低对英伟达芯片的依赖。
根据国泰君安证券研报,AI芯片主要分为三种类型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)。三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU(一种专门为机器学习任务设计的AI ASIC)。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。
目前,国内GPU厂商代表有壁仞科技、天智数芯、摩尔线程和沐曦等;AI ASIC厂商代表有华为海思昇腾、寒武纪、燧原股份等。
2024年8月以来,国内AI算力厂商陆续启动IPO辅导。2024年8月26日,AI ASIC领域代表厂商燧原科技启动IPO辅导;GPGPU领域代表厂商壁仞科技于9月11日启动IPO辅导;11月12日,GPU厂商摩尔线程启动IPO辅导。
进入2025年,1月15日,沐曦股份也启动了上市辅导。若四家全部上市成功,将大幅扩展A股AI算力厂商投资标的的供给。
这几家接受IPO辅导的企业中,燧原科技创始团队有AMD背景,其创始人兼COO张亚林于2008年加入AMD,历任资深芯片经理、技术总监。曾经作为全球芯片研发主要负责人之一,在AMD上海研发中心成功领导开发并量产了多颗世界级芯片,拥有丰富的工程和产品化实战经验。
沐曦股份创始团队同样来自AMD,其创始人陈维良曾任AMD全球GPGPU设计总负责人;两位CTO(首席技术官)均为前AMD首席科学家,目前分别负责公司软硬件架构。
而摩尔线程创始团队来自全球GPU巨头英伟达,其创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理,在GPU这一行业已经深耕近二十年。
除了这四家接受IPO辅导的厂商外,天数智芯、昆仑芯、平头哥等厂商也广受市场关注。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”
凤凰财经官方微信