7月11日,一条看似普通的行业消息,引发了芯片圈的广泛关注。
据The Information报道,华为正在改变其AI芯片战略,从此前以昇腾为代表的专用ASIC芯片路线,转向更通用的GPGPU架构。表面看,这是一次架构选择的变化,实际上,是一场向英伟达“正面进攻”的信号。
消息不长,但分量不轻。
为什么?因为这意味着——华为要做“中国自己的英伟达”了。
过去几年,华为AI芯片主打的是华为昇腾系列。讲白了,这是走的ASIC路线,专门为AI推理和训练场景优化设计。效率很高,功耗控制也好,但最大的问题在于:它太“专”了。
这几年,AI行业变化极快,从语言模型到多模态,再到科学计算、模拟仿真,光靠一块“专用芯”已远远不够。AI芯片要能“打全场”,这时候,像英伟达这样的GPGPU架构优势就出来了。
GPGPU,本来是干图形渲染的。但自从英伟达开发出CUDA平台,它就被AI行业“拐跑”了。通用、灵活、适配各种算法,加上几十年积累下来的软件库、开发框架、生态资源,几乎垄断了全球AI训练市场。
而华为昇腾虽然功耗、单位性能都不错,但它只适合在华为自有的CANN平台上跑。MindSpore虽然也在发展,但没生态,就等于没开发者,没开发者,就没人用。
这是华为必须改变的第一个理由:生态孤岛,再强也是孤岛。
华为不是第一家走通用GPU路线的中国企业,但它是第一家真正能把这事做“深”的。
The Information的报道透露,这一次华为的转型不仅仅是硬件上的,还会配备一套新的软件兼容系统,可以“翻译”CUDA程序,让开发者写的英伟达代码能直接在华为芯片上运行。
说白了,这是在修一座桥,把开发者从英伟达的“帝国”里接出来。
这条路,别家也在走。像摩尔线程、壁仞科技,也都推出了GPGPU芯片,并试图做CUDA兼容。但区别在于,华为有资源、有场景、有客户,也有被封锁的“生死决心”。
这也是为什么这一次,行业格外关注。
GPGPU不是做出来就完事的。它的挑战,分三层。
第一,硬件设计本身非常难。
不是谁都能做出一个“英伟达级”的GPU,尤其是FP64双精度浮点运算,这种在科学计算、工程仿真里必需的能力,是国产芯片普遍欠缺的。华为之前的昇腾,是专门优化低精度AI运算的,像FP16、INT8这些,它做得很好,但双精度几乎没有。
第二,生态迁移的成本极高。
今天的大模型,训练几乎全依赖CUDA,从PyTorch到TensorFlow,到各种预训练参数、微调模型,底层都是CUDA。如果你的GPU跑不了这些,就很少人用。
第三,芯片制造能力受限。
就算华为能设计出一款世界级GPGPU,台积电不给代工怎么办?5nm以下的高端制程,目前对华为仍然是个难点。芯片不是PPT,要落地才有意义。
所以这场战,远比外界想象的艰难。它既要技术突破,也要生态重构,还要绕过制裁封锁。
说白了,这就是一场硬仗。
如果是在一个完全开放的市场,华为可能不会这么急于“通用化”。但现实不允许它慢了。
英伟达的H100、A100系列,被美国一纸禁令限售中国。
H20虽然是“阉割版”,但依然是国内数据中心的“抢手货”。
所谓“国产替代”,喊了很多年,但到今天真正能落地替代英伟达的,还没有。
华为此举,是冲着这块市场空档去的。
从数据中心,到科研院所,再到大型国企、金融、电力、能源,中国有着巨大的AI训练与高性能计算需求。问题是——买不到英伟达,其他国产芯片又不够用。
华为要补的,是这个“刚需+制裁”的市场缺口。不是为了秀肌肉,而是为了生存、战略安全、数据主权。
这不是一个轻率的问题。今天的英伟达,已经不再是几年前“显卡做AI”的公司,而是全球AI算力标准的定义者。
华为要想在GPGPU赛道站稳脚跟,至少要迈过三道坎:
硬件性能得够格,不能只是“国产能用”;
软件生态要打通CUDA兼容,最好还能构建自己的“下一代CUDA”;
客户落地要扎实,拿出几个“重型项目”带路,比如政务、金融、电网等国产替代最刚性的场景;
但华为有它的优势:
在今天这个节点上,华为可能是中国最有机会做这件事的公司。
它吃过苦,有大模型、有鲲鹏CPU、有CANN生态,最重要的是——它已经没有退路。
今天的AI芯片市场,不是技术人的竞技场,而是科技民族工业的决战场。
华为从ASIC转向GPGPU,不仅仅是一次产品迭代,更是一次底层路线的重估与背水一战。
这一仗,也许打十年。但如果中国要有自己的AI底座,就必须有人站出来把这条路铺出来。
这一次,轮到华为了。
扩展阅读