
“黄仁勋对OpenAI的商业战略感到不满!”
2月3日,多家媒体报道称,英伟达对OpenAI的1000亿美元投资交易存在不确定性,而OpenAI自去年以来就在寻求英伟达芯片的替代方案。
虽然黄仁勋表示“对OpenAI不满”的报道“毫无根据”,但据知情人士称,黄仁勋在与投资者沟通时,已经将‘投资额达到1000亿美元’,改为说‘规模庞大’。多重迹象开始让市场不安,拥有多家非GPU芯片供货支持的OpenAI,正缓慢远离英伟达。
无独有偶。今年1月底,微软时隔两年,推出第二代非GPU AI芯片Maia 200,直接挑战英伟达的地位。其采用台积电3纳米工艺,性能较现有主流算力硬件提升30%,相比亚马逊AWS第三代AI芯片效能提升3倍。
然而,就在几个月前,英伟达官宣与 OpenAI、微软、英特尔、xAI 等公司展开更深入的合作,此外,英伟达还计划以50亿美元收购英特尔股份。
但如今,微软、OpenAI等这些“铁杆盟友”正悄悄远离英伟达GPU,非GPU技术赛道正在响起“莱克星顿的枪声”。
微软、OpenAI发力非GPU芯片,千亿级赛道将崛起
不可否认的是,过去三年多的ChatGPT、DeepSeek、AI Agent智能体技术热潮,让AI大模型从技术探索,走向了大规模应用,也让全社会对AI算力的需求呈现指数级增长。
但与此同时,如今AI应用的底层大模型开发者也逐步收敛至阿里、字节跳动、智谱、MiniMax等头部几家大模型厂商。而且,AI Agent智能体、具身智能等推理需求增加,这使得 AI 加速卡厂商所需适配的大模型逐步收敛,逐步减弱对于英伟达GPU和CUDA生态的依赖,包含ASIC(专用AI芯片)、可重构技术路径的非GPU芯片正在崛起。
这类非GPU芯片,以算法为中心、AI计算特征等进行设计和优化,在应用场景下运行效率更高,性价比更优。
作为英伟达的云计算大客户,微软也选择了自研定制非GPU AI芯片Maia。
早在2019 年,微软正式启动首款自研 AI 芯片的内部研发工作,初期研发重心围绕云场景的图像处理与基础算力支撑展开,2023年11月发布首款自研 Azure Maia 100 AI 芯片,采用5nm制程工艺,专门适配云环境下的 AI 训练与推理负载。
如今,微软第二代自研 AI 芯片 Maia 200时隔两年正式推出,并率先部署于美国中部的 Azure 核心数据中心。分析指出,这款AI芯片将让微软减少对英伟达的依赖。
不止是微软。OpenAI于去年10月宣布与ASIC龙头博通(Broadcom)展开深度合作,双方以高达数十亿美元,将在未来四年内共同开发并部署总计10吉瓦算力的定制AI芯片及计算系统;
奥特曼此前多次表示,目前OpenAI的计算能力“仍远远不够”,随着AI产品需求的持续飙升,他们计划在全球范围内新建多个大型数据中心,以支撑下一代AI模型的训练与运行。
显然,无论是微软Maia AI芯片,还是OpenAI定制AI芯片、谷歌TPU芯片,其目标均为一致:替代英伟达GPU、打造非GPU芯片,并无缝接入数据中心、为客户节省成本并提升效率。
预计到2033年,OpenAI将投资超过10万亿美元建设总计250吉瓦的计算能力,相当于当前全球AI算力总和的数十倍。而为了加速算力扩张步伐,公司必须节省资金换取更多计算能力。
Gartner 分析师Chirag Dekate表示,AI数据中心日益增长的能源需求,以及世界许多地区新能源的匮乏,使得像微软Maia这样以效率为导向的AI芯片显得尤为重要。
根据高盛全球投资研究部的预测,预计到2027年,全球AI芯片中非GPU芯片的出货占比将从2024年的 36%,逐步增长至45%。
全球共识,催生中国AI芯片市场“非GPU四小龙”
黄仁勋曾多次表示,中国是全球第二大AI算力芯片市场,规模超过500亿美元,且发展迅速。这是一个非常重要的市场,充满活力,尤其是阿里Qwen、DeepSeek等开源模型让AI算力需求持续增长。
如今,非GPU赛道已经崛起,尤其国内“非GPU四小龙”寒武纪、燧原科技、昆仑芯、清微智能,以自主架构、全栈能力、规模化落地构筑绝对壁垒,与AI芯片领域其他企业形成代际差距,以发展中国自主可控AI芯片。
四家泾渭分明,寒武纪在全栈自主可控,筑牢国产高端 AI 芯片安全底座;昆仑芯在集群工程以及确立大规模商用行业标准;燧原在云端训推全栈闭环,适配大模型时代智算中心核心需求;清微智能强在可重构与晶圆级领域拥有创新能力,依靠灵活性、低功耗、高密度特性解锁太空算力等新兴场景,四者共同构建起对标国际、自主可控的国产非通用 GPU 产业矩阵,引领中国 AI 芯片实现结构性突围。
其中,寒武纪依托中科院技术积淀,掌握自主架构与全栈软件链,是国内覆盖云边端的AI芯片龙头,高端训推芯片在信创与头部互联网实现高市占替代。今年1月底,寒武纪宣布公司2025年全年营业收入预计超过60亿元,同比增长逾410%。
百度昆仑芯则凭借万卡级大集群工程能力、自研架构等适配大模型推理,以及拥有运营商与百度智能云集采优势,确立行业领先地位。近期,百度宣布昆仑芯秘密向港交所提交IPO招股书。
成立于2018年3月的燧原科技拥有成熟千卡集群方案,是国内智算中心规模化建设的核心供应商之一。今年1月,燧原科技正式向上交所提交IPO招股书,公司主要研发非通用GPU AI芯片,最新估值超过180亿元。
作为与摩尔线程、寒武纪等齐名的北京四大明星AI芯片企业,刚刚完成股改的清微智能,同时拥有可重构数据流和晶圆级芯片技术,也是区别于摩尔线程GPU、寒武纪ASIC的另一个创新技术路线的非GPU AI芯片代表企业。
所谓可重构数据流技术路线,是指根据数据流动态重构计算路径,能够适应多元化的算法,随时调整电路连接方式,相比GPU可大幅减少能耗,相比静态ASIC又保留了对模型演进的适配能力,在应用场景下运行效率更高,性价比更优。
此外,清微智能创始人尹首一带领团队自2020年起前瞻性地瞄准超高性能大模型训练与推理场景,开展晶圆级芯片这一前沿技术路线的探索,将可重构算力网格架构和晶圆级芯片形态结合,打造出可用于“太空算力”的AI芯片产品,市场含金量更高。
晶圆级集成芯片凭借高密度低载荷、灵活易扩展、高能效等特性,已经成为太空算力发展的重要技术路径。清微智能将其与原创可重构计算(RPU)结合,形成“非GPU”的差异化技术壁垒,这正是其跻身北京四大明星AI芯片企业的核心价值所在。
据IDC数据统计,预计到2028年,中国AI加速卡市场规模将从2024年的2164亿元预计增长至超1.1万亿元,占全球份额约30%。
其中,非GPU服务器市场规模将接近50%。这意味着,未来国内非GPU芯片公司将拥有更大的市场前景。