编者按:12月10日,由《巴伦周刊》资深科技作者金泰(Tae Kim)撰写的英伟达商业科技图书“The Nvidia Way: Jensen Huang and the Making of a Tech Giant”(英伟达之道:黄仁勋和科技帝国的诞生)在海外正式发售。该书的官方简体中文版也由中信出版社同步出版。
恰巧就在近日,英伟达先是被中国市场监管总局依法反垄断调查,随后美最高法院允许投资者对英伟达提起集体诉讼。
就像该书中所描述的,英伟达似乎永远处于风暴中。
而这次,黄仁勋会如何带领英伟达破局?
三十年前,英伟达三位联合创始人之一的普利姆,以“先发制人”的方式,倒逼黄仁勋和另一位联合创始人马拉科夫斯基分别从原雇主LSI公司和太阳微系统公司离职。这便有了之后的英伟达。在英伟达当了三十多年CEO的黄仁勋,也成为了科技圈任职时间最长的CEO。
2022年11月,ChatGPT的问世让英伟达成为全球瞩目的科技巨星,其市值一度超过微软,两年时间翻了三倍达到三万亿。“为什么必须是英伟达?”“为什么其他芯片公司的芯片无法满足训练大模型的极致性能要求?”这些问题一遍遍被问及。
罗马非一日之工,英伟达能在大模型时代脱颖而出,并非偶然。复盘英伟达从一家名不见经传的小公司到成长为如今的芯片巨头,创造GPU、提前布局CUDA以及黄仁勋的领导力或许是这三十年英伟达成功的关键。
只不过,没有永远的成功,目前摆在英伟达面前的可能是比产品能力更棘手的问题。
创造GPU
在英伟达之前,世界上没有一个叫“GPU”的东西。追溯第一款GPU的诞生,要从“GeForce 256”说起。GeForce 256集成了一个硬件光影转换引擎,主要进步是承担了一些原本由CPU承担的任务,减轻CPU运算负载,提升计算机运行速度。
但英伟达没有以“GeForce 256”发布这款具有突破意义的“显卡”——“必须找到一种方法,把这个产品定位成比市场上任何其他产品都更好的3D图形处理器”。于是在30分钟的头脑风暴过后,英伟达决定:把新的芯片命名为全新产品类别的第一款产品,即图形处理器(GPU),它在图形渲染方面的作用就像CPU 在所有其他计算任务中的作用一样。
自那之后,GPU获得了可以明确与CPU进行比较的新地位,确切地说是英伟达发明了GPU。
图形芯片脱颖而出,并且GPU的命名也让其与CPU的价格差距急剧缩小。
那年是1999年8月。接下来的几十年,英伟达销售了数亿张显卡。
“我们不存在只追求市场份额的文化。我们更愿意创造市场。”英伟达高管杰伊·普里说,而这也是黄仁勋经常对英伟达员工传达的价值观。
颠覆性创新最终会创造出新的应用场景,而且初创公司通常能够比暂时领先的公司更快地迭代和创新。现在英伟达做到了。
数据显示,在最近的十年,英伟达在独立显卡/集成显卡上的市场份额一直保持80%左右。
提前布局:CUDA
当然,英伟达的腾飞并不只是因为发明了GPU,毕竟这家公司是卖了将近三十年的显卡,才在ChatGPT引爆生成式AI之后,变得“一卡难求”。报道显示,2023年年初,各大公司为了训练大模型,英伟达GPU曾被炒到十几万一颗。这也是为什么英伟达市值能在短短两三年之内翻三倍。
但需要关注的是,乘上生成式AI的风口,并不是因为英伟达有什么天大的好运,也不是因为埋头为游戏行业做了三十年显卡,最重要的是,在生成式AI爆发前的十几年前,英伟达看上了“将GPU用于通用计算”的生意,并耗资多年秘密研发CUDA。
何为CUDA?
简单来讲,CUDA是芯片编程模型,即统一计算设备框架,有了这个框架,无论是图形编程专家还是科学家和工程师都可以利用GPU的计算能力。相当于在图形计算和非图形的通用计算之间搭建了一个桥梁。彼时,黄仁勋已经认定,GPGPU(基于GPU的计算通用计算)有可能将GPU的市场扩展开来——GPU的天花板被加高了。
有意思的是,最初发现GPGPU市场的并非英伟达,而是学术界的一些高校和研究机构将GPU拿来做相关研究。他们先是破解了GPU,尝试将非图形计算重构为GPU可执行的函数。而后发展到开始形成社区,讨论使用GPU编程语言的最佳方法,以将其应用于理解蛋白质折叠或确定股票期权定价。
创造GPGPU概念的研究员哈里斯很快成为了英伟达的员工。2006年11月,秘密研发4年的CUDA连同英伟达第一款具有计算功能的GPU芯片G80被推出。G80拥有128个CUDA内核,通过使用硬件多线程特性,GPU能够在这些内核上同时运行多达数千个计算线程。相比之下,英特尔当时的“酷睿2”CPU最多只有4个计算线程。
时间推进到2012年,多伦多大学教授杰弗里·辛顿(没错,就是那个双诺奖得主辛顿)和他的两名学生(没错,其中一位就是伊利亚·苏茨克维,那个OpenAI前首席科技学家)在李飞飞实验室举办的ImageNet图像识别竞赛中取得了重大突破。他们使用基于CUDA的深度神经网络AlexNet,在比赛中以显著优势胜出。
AlexNet的获胜为英伟达带来了巨大的公关效应,因为辛顿三人仅用一对售价几百美元的消费级GPU两周内完成了AlexNet的训练。
这次胜利不仅标志着深度学习时代的到来,也展示了CUDA在加速机器学习算法方面的巨大潜力。从此,越来越多的研究人员和企业开始采用CUDA,英伟达也在CUDA生态上进行了巨大投入(创建AI软件库、创建支持CUDA的框架和工具等),推动人工智能领域的快速发展。
黄仁勋的领导哲学
无论是发明GPU还是发明CUDA,英伟达并非一帆风顺,甚至数次资金耗尽、濒临破产。但英伟达都以一种奇迹的方式重生了。
英伟达能够一次次度过危机,黄仁勋的领导者角色一次次被凸显。可以毫不夸张地说,黄仁勋对公司文化的深远影响,构成了英伟达成功的核心要素。而一种坚韧不拔、勇于创新的企业精神,不仅塑造了英伟达的企业文化,也激励着每一位员工不断超越自我、追求卓越。
就以CUDA的研发过程来说,CUDA和G80耗费大量资金,2008财年英伟达毛利率从45.6%下降到了2010财年的35.4%,2007年10月至2008年11月,英伟达股价暴跌超过80%。
即便如此他们依然坚持每款芯片都能兼容CUDA。黄仁勋后来评价,CUDA为英伟达的芯片增加了大量成本,但是他确信,加速计算将解决正常计算机无法解决的问题。“我们必须做出这样的牺牲,我对它的潜力深信不疑。”黄仁勋说。
英伟达第一款打出名头的产品是1997年4月游戏开发者大会首次展示的RIVA 128,该芯片应用了带宽128位的内存总线,是消费级个人电脑领域首次使用该技术的芯片。RIVA 128物理尺寸大于之前任何成功制造过的芯片,整颗芯片晶体管数量为350万个。
RIVA 128一经推出,芯片基准测试表现超越了当时任何消费级显卡的性能数据,其中包括英伟达最大竞争对手3dfx的最好的显卡(后者于2002年10月正式申请破产,其专利和其他资产被英伟达收购)。这不仅让英伟达获得了来自苏特希尔承诺投资的180万美元,也获得了来自STB Systems的3万颗RIVA 128芯片订单,助力英伟达度过生存危机。1997年第四季度,英伟达实现140万美元利润,这是公司成立4年来首次单季度盈利。
但大家不知道的是,在RIVA 128推出之前,公司刚刚经历了NV1的失败。英伟达耗费了1500万美元开发的NV1遇上了糟糕的销售结果,公司陷入现金危机。当时黄仁勋面临两个事实:一是大多数图形芯片从概念到上市需要2年时间。二是英伟达资金只能再撑9个月。
如何以“光速”、以史无前例的速度将显卡推向市场?
抛开对芯片研发、测试流程不谈,英伟达采取了各种方式突破极限。
3dfx破产后,原3dfx工程师入职英伟达,但他们惊奇地发现,这里并没有什么秘密武器。“只是最大限度地努力工作和严格执行时间表。”该工程师说。而正是因为这次RIVA128的攻坚,黄仁勋明白自己不仅是一名技术工程师,更应该做好的是一名管理者和领导者。
2024年11月,获得港科大工程学荣誉博士学位的黄仁勋谈及自己的领导哲学。他说,作为CEO和领导者,学到的一个关键点是:你不需要知道一切。“你可以对自己的方向充满信心,但同时也要允许存在不确定性。第二点,作为领导者,需要展现力量,因为团队成员会从你的力量中获得信心。然而,力量并不意味着不能表现脆弱。最后一点非常重要:不要为了自己而做,而是为了他人。真正被信任的领导者是那些每一个决定都以团队使命、他人成功为导向的人。”
直接管理60位高管,透明度是关键。当公司需要确定方向、制定策略或做出决定时,他不会一个人进入“森林”深思熟虑,然后带着答案回来告诉大家该怎么做。相反,我们会一起推理、讨论,最终得出结论。“我通常是最后一个总结发言的人,我的职责是确保每个人都听到并理解相同的信息,消除任何可能的歧义。”
经历风暴
就在发稿前一周,12月9日,英伟达因涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告〔2020〕第16号),市场监管总局依法对英伟达公司开展立案调查。
消息一出,英伟达股价当天收跌2.55%,第二日续跌2.69%,两日跌去超800亿美元市值。在随后的回应中,英伟达发言人表示,乐于回答监管机构关于业务提出的任何问题,但强调英伟达凭借优势在市场中取胜,且努力在每个地区提供最好产品、履行承诺。
随后的12日,英伟达中国官方微博再发声明,辟谣英伟达断供中国的的不实传闻,并表示,中国是NVIDIA重要的市场,未来将持续为中国客户提供高质量服务。同日,媒体报道,英伟达今年在中国加大招聘力度,以增强研发能力并专注于最新的自动驾驶技术。但这些显然都不够,12月13日,在经历了小幅微涨的短暂行情之后,英伟达收盘再跌2.25%至 10 月 31 日以来的最低水平。上周共计下跌 5.75% 至 134.25 美元/股。
与此前任何一次危机一样,英伟达似乎又到了一个“低谷时刻”。英伟达历经30年在GPU技术上的积累,已经让其成长为了一个GPU巨头。“涉嫌垄断”是英伟达当下挥之不去的达摩克利斯之剑,使其处于新的风暴中。
中国被认为是AI应用最火热的地区,除非英伟达要放弃这一潜力巨大的市场,否则如何公平地满足中国爆发的GPU需求,将是英伟达作为芯片巨头必须妥善解决的问题。
放眼全球,不止中国对其展开反垄断调查,美最高法院近日也允许投资者对英伟达提起集体诉讼,并驳回了英伟达的上诉请求。这是继法国、欧盟、中国对英伟达展开“反垄断调查”以来,英伟达陷入的最新司法纠纷。
英伟达该如何破局?
可以看到,黄仁勋近期正频繁在公共场合露面,并强调英伟达GPU对于当前AI时代的重要性。黄仁勋曾表示,有两大趋势正在推动英伟达芯片在全球的普及:首先,整个计算领域从CPU支持的编程转向GPU支持的机器学习;其次,AI领域的产业发展。他表示,随着基础模型制造商扩大AI预训练、训练后以及云端AI推理算力的部署规模,市场对Hopper芯片和对Blackwell芯片的需求将持续增长。
Hopper芯片在ChatGPT爆发后变得炙手可热,H100芯片在全球上演一卡难求;而Blackwell芯片,则是英伟达被寄予厚望的新一代芯片。按照此前英伟达产品沿革的惯例,如若Blackwell芯片能够获得较好的市场反馈,英伟达有望一扫阴霾。
但Blackwell芯片在今年年中曾出现设计瑕疵,生产和交付时间因此推迟了至少三个月。并且,该产品生产初期的成本一度压低了英伟达三季度的毛利率。
据黄仁勋最新透露的消息,瑕疵问题目前已彻底解决,且谷歌、微软和Meta等公司都计划购买新芯片,在性能上,Blackwell运行成本比之前AI模型的成本的 Nvidia H100 低 25 倍。同时,Oracle 已经为其Zettascale 超级计算集群订购了约 131,000 块 Blackwell GPU作者 | 秦聪慧,注:本文关于英伟达创业历史主要参考新书《英伟达之道》(中信出版社出版))
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”