英伟达,不止是硬件公司,更是平台巨头。其cuda计算平台是高性能并行计算的基石,只要用英伟达显卡做高性能计算,就绕不开cuda。和IOS生态之于苹果手机类似,cuda生态是英伟达的核心竞争力,周边配套工具都基于此,十年领先优势明显,各大公司只能被“宰”。
过去十年,AI圈有个残酷现实:英伟达构建了高性能计算的软硬件及工具生态标准,做生产只能选英伟达。直到deepseek横空出世,它开源后,用Meta二十分之一的成本,打造出性能强十倍的大模型,实力与chatgpt最新版相当。不仅公布代码、测试方式和数据,还发表新架构论文。众人从质疑到复现其训练过程,最终心服口服。
深入研究后,人们发现deepseek改造了英伟达底层的cuda生态,用更底层的ptx语言重写硬件逻辑,让20个流处理器干了cuda规定之外的事,弥补阉割版显卡在网络通信中的不足,相当于绕过英伟达的管理平台和计算生态,直接指挥硬件,这也是英伟达股价崩溃的主因。
此前并非没人想过这么做,一是大模型初期大家重速度和效率,美国资金充足,买英伟达显卡方便,没必要自找麻烦;而中国被制裁,硬件资源匮乏,只能剑走偏锋。二是大语言模型发展到新阶段,deepseek利用自身推理模型完成海量ptx代码优化,这是人力难以完成的。
如今,英伟达面临危机,不知如何向投资人证明cuda未来几十年仍不可撼动。AI教皇被AI革命,令人唏嘘。
$英伟达(NVDA)$