英伟达在中国市场恐怕真的回不去了。
在过去的中国AI芯片市场,英伟达拿下了95%的份额,但因为美国的限制与禁令不断收紧,现在,黄仁勋说已经变为0%了。现在虽然H20、H200都放开了,依然无法改变这一情况。
现在情况已经反过来了,不是中国求着英伟达买,而是中国买不买,不是英伟达说了算了,毕竟不是你说不卖就不卖,你说卖我们就得买。H20、H200都放开了,但国内依然没有厂商下订单,导致英伟达的市场份额,直接变为了0%。

那么中方明显追求的,已经不是求着英伟达买,然后隔三差五等着被卡脖子了,而是尽量让自己的AI芯片能够真正站起来。如果国产芯片追上英伟达,达到或接近H200的水平,那禁令就毫无意义了,中国再也没有必要再买英伟达的AI芯片了。
现在,打破这一局面的,还是华为。
近期华为有两个动向,其一是2026年3月,在西班牙巴塞罗那举行的世界移动通信大会(MWC2026)上,华为首次面向海外展出了基于自研昇腾芯片的AI超节点产品——Atlas 950 SuperPoD,这是一款能和英伟达正面硬刚的“大杀器”。

华为的单颗芯片因为制造工艺受限,性能打不过英伟达的顶级产品,但华为想出了一个绝妙的办法:既然一颗打不过,那我就把成千上万颗芯片变成一个超级团队。
Atlas 950就是把8192颗华为芯片,用一套自研的“灵衢”互联技术连接起来,让它们协同工作,变成一个算力怪兽,华为这套集群的总算力,是英伟达计划中下一代产品的6.7倍。而内部通信上,华为这套网络的内部数据传输速度,是英伟达的62倍。
简单来说,华为在单个芯片性能暂时落后的情况下,通过革命性的通信技术,把海量芯片高效地组织起来,用“堆人海战术”加“超强组织能力”,打败了“少数特种兵”。
而也在近期,在华为中国合作伙伴大会2026上,华为发布了AI加速卡Atlas 350,这张加速卡,使用的是全新昇腾950PR(Ascend 950PR)处理器。
其性能方面,相比于之前的芯片,有了非常大的提升。数据显示,Atlas 350的FP4精度算力为1.56P,带宽为1.4TB/s;功耗为600W。Atlas 350的单卡算力达到了英伟达H20的2.87倍,更是国内唯一支持FP4低精度的推理产品。

此外,其HBM(高带宽内存)容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。
这意味着,集成Atlas 350板块的服务器能够支持更大的模型以及时延更低的推理,精度小了,计算速度就会更快,寄存器效率也会更高。
目前这款产品正式上市,面向合作伙伴发售,而在这个大会上,已经有众多的厂商,发布了基于Atlas 350的服务器产品,意味着华为正式向这领域发起冲锋,去替代英伟达的市场了。
从Atlas 950 SuperPoD到Atlas 350,这两款产品前后脚发布,正在实现算力的“分层分级”供给。
当前AI市场已分化:一边是万亿参数大模型的预训练需要“暴力美学”,另一边是AI应用落地(如“养虾”Agent热潮)需要高性价比的推理算力。
Atlas 950 SuperPoD 是用于搭建“AI发电厂”(训练中心)的巨型系统,解决的是“有没有算力”和“算力够不够强”的问题;而 Atlas 350 则是用于“AI应用落地”(推理部署)的高效工具,解决的是“算力贵不贵”和“用不用得起”的问题,两者同期发布,体现了华为从芯片到集群的全栈掌控力。
很显然,华为正在给了全世界“第二个选择”:以前,搞AI大模型,基本绕不开英伟达。华为的出现,所有的客户有了第二选项,这意味着所有鸡蛋不用放在一个篮子里了。包括欧洲、东南亚的一些国家和企业,都有了一个性能同样强大的备选项。

原来围着英伟达的CUDA转的圈子,一部分开始围着华为的昇腾生态转,这就像全球手机市场生态系统之争,不再是哪家一家独大,而是苹果iOS和谷歌安卓形成双雄之争,以后AI芯片与算力的竞争,也将变成了两大生态的竞争。
估计这么一来,英伟达恐怕是真的不淡定了,毕竟,长江后浪推前浪,一旦越来越多客户选择倒向华为,这个原本由一家公司主导的世界,开始打开了一扇全新的大门,因为华为在国内的影响力太大了,现在又有这么强的产品推出,在现场,众多核心伙伴首发基于Atlas 350的整机产品,标志着昇腾950代际推理算力正式进入商用阶段,这么多合作伙伴支持,意味着国内一众厂商是真的是有意识的选择另外一个生态圈了,英伟达要把500多亿美金的市场重新捡回来,恐怕会越来越难了。