科技与自然
·
纽约时报
·
2026-06-26 06:10

纽约时报:中国AI模型与Anthropic、OpenAI性能差距缩小

两周前,在美国政府突然要求对其两款最强大的人工智能系统访问权限设限后,人工智能公司Anthropic关闭了这两个系统。

几天后,中国初创公司智谱发布了一款人工智能模型,性能几乎与Anthropic的Fable和Mythos模型相当。不过,智谱这款新技术的使用成本要低得多,且在美国不受任何限制。它很快便登上了全球最受关注的人工智能模型排行榜前十。

智谱站在中国新一波高性能、低成本人工智能浪潮的最前沿,这股浪潮正在挑战OpenAI、Anthropic和谷歌长期以来对行业的主导地位。目前,全球人工智能模型排行榜中有六款来自中国。

智谱的新模型GLM-5.2发布之际,美国企业已意识到必须压缩人工智能开支。与此同时,硅谷高管们也越来越担心,特朗普政府正倾向于加强对人工智能行业的监管。

“随着Fable受到限制,美中之间的差距已经微乎其微,”硅谷初创公司alphaXiv联合创始人里汉·艾哈迈德说道。过去一周多来,他一直在使用智谱的新模型。

不过,中国模型在美国广泛普及仍面临两大障碍:一是人们担心它们与中国政府关系密切;二是有人指责中国企业利用美国技术、以不公平的方式开发出这些成本更低的模型。但它们低廉的价格仍不断吸引新的用户。

大约一年半前,中国初创公司DeepSeek令硅谷大为震惊,它证明自己能够以远低于许多美国同行的成本构建高性能的人工智能系统。如今,智谱正在做类似的事情。根据运营人工智能排行榜的初创公司OpenRouter的数据,在处理某些任务时,GLM-5.2的使用成本仅为Anthropic此前推出的Claude Opus 4.8的约八分之一。Claude Opus 4.8的发布时间略早于Fable和Mythos。

与大多数顶级中国模型一样,GLM-5.2页是开源软件,这意味着任何人均可免费使用和修改。这使得其使用成本大大降低,即使其性能可能不如美国公司的产品。

“你有必要去哪儿都开法拉利吗?”麦德罗纳风险投资集团的创业投资人初创投资人维韦克·拉马斯瓦米问道。“恐怕不会吧。”

智谱未回应置评请求。

ArenaAI的首席执行官阿纳斯塔西奥斯·安杰洛普洛斯表示,智谱的技术尤其受从事人工智能代理开发人员的欢迎。 Brennan Smart for The New York Times

GLM-5.2在生成计算机代码和驱动人工智能代理(能够调用其他软件执行任务的数字助手)方面尤为出色。ArenaAI首席执行官阿纳斯塔西奥斯·安杰洛普洛斯表示,智谱的技术目前在全球人工智能任务使用量中排名第三。ArenaAI追踪数百万人工智能用户。

包括微软和亚马逊在内的大型云计算提供商已在提供对智谱、DeepSeek、MiniMax等中国初创企业旗下部分系统的访问服务。两名不便具名的知情人士还透露,微软也在考虑将DeepSeek最新模型加入自家某款产品,作为Anthropic和OpenAI技术之外的另一种选择。

Axios此前率先报道了这一消息

微软、Anthropic和OpenAI均拒绝置评。

一些软件开发人员不愿使用智谱在中国境内计算机上提供的人工智能系统,因为他们担心与该公司或中国政府共享数据。此外,他们也顾虑中国对人工智能内容的审查,以及可能触犯美国出口管制规定。

2025年,美国商务部将智谱列入实体清单。公司文件显示,该公司数名股东受中国一家监管国防工业的政府机构控制。

网络安全公司Infoblox首席法务官陈玮(音)表示,只要在系统设置上谨慎操作,企业仍可在不将数据传回中国、不违反美国出口法规的前提下使用这一模型。

初创公司alphaXiv的艾哈迈德说:“如果你自己部署这些中国模型,或者通过第三方服务商使用它们,它们就没有那些限制。现在,反倒是Anthropic的模型受到更多限制。”

在DeepSeek于2025年发布后,世界各国出于数据安全担忧出台了限制其使用的法规。但陈玮表示,到目前为止,GLM-5.2尚未引发类似的担忧。

DeepSeek的人工智能助手性能曾震惊硅谷。 Kelsey McClellan for The New York Times

Anthropic和OpenAI均指控中国企业不当收集其人工智能系统的数据,以加速中国技术的发展。周三,Anthropic致信南卡罗来纳州共和党参议员蒂姆·斯科特和马萨诸塞州民主党参议员伊丽莎白·沃伦(《纽约时报》已看到了这封信),指控中国科技巨头阿里巴巴通过2.4万个虚假账户“肆无忌惮地”和“非法地”试图复制其技术。

阿里巴巴拒绝置评。

本月,微软人工智能实验室负责人穆斯塔法·苏雷曼在发一系列新模型时强调,这些模型是基于公司已获得商业许可的数据从头开始构建的。

“这意味着你可以完全放心地、以值得信赖的方式将其投入生产,”他说。

(《纽约时报》已起诉OpenAI及其合作伙伴微软,指控二者未经授权使用新闻内容训练人工智能系统。两家公司均否认这些指控。)

利用一个系统的数据训练另一个系统——即所谓的"蒸馏"——在人工智能开发领域颇为常见。但Anthropic和OpenAI的服务条款明确禁止任何人私自收集数据用于蒸馏。目前尚不清楚智谱在开发其技术时是否使用了蒸馏手段。

提供GLM-5.2访问服务的公司Baseten的模型训练负责人查尔斯·奥尼尔表示,仅靠蒸馏并不足以打造出一流的人工智能系统,还需要多种其他复杂技术的配合。

奥尼尔说:“那种认为这些模型的所有能力都源自Anthropic的说法并非人们所说的那样属实。”

" data-src="https://img.beimg.com/data/2026/06/26/pic_536899653_b.webp" style="box-sizing: border-box; border: 0px; width: 770px; height: auto;">

Baseten公司的模型训练负责人查尔斯·奥尼尔表示,开发智谱这样的顶级人工智能系统需要多种复杂技术的配合。 Justin T. Gellerson for The New York Times

中国的人工智能初创企业之所以能以远低于其他行业的价格提供开源技术模型,部分原因是该行业多年来受益于中国政府的支持,中国政府将人工智能视为推动经济增长的关键引擎。

许多高管表示,美国公司不应将技术开源,因为这可能被用于有害用途。但另一些专家认为,若监管机构在美国压制开源技术,中国将因此获得巨大的竞争优势。

这些专家指出,由于目前大多数性能领先的开源模型都来自中国,美国开发者未来很可能会建立在这些中国模型之上开发软件。从长远来看,这可能使中国成为全球人工智能发展的核心。

也有人认为,由于美国出口管制限制了训练人工智能所需高端芯片的供应,中国模型始终会落后于美国最先进的模型。智谱和其他中国初创公司不得不花费巨资租用中国境外数据中心的芯片资源。

智谱在香港的备案文件显示,2025年上半年,公司用于计算服务的支出超过营收的七倍,这些费用本质上就是支付给境外算力提供商的计算资源成本。

智谱迅速在美国的软件开发人员中流行开来。 Raul Ariano/Bloomberg

尽管如此,专家估计中国落后美国公司的差距已经缩小到六个月甚至更少。

“此前有种猜测认为,随着出口管制逐渐发挥作用,美国前沿模型与中国模型之间的差距将持续扩大,但GLM正在将局面推向相反方向,”乔治华盛顿大学专门研究新兴技术与国际关系的助理教授杰弗里·丁(音)表示。

随着Fable和Mythos暂时退出市场,越来越多企业意识到替代方案的重要性。

“大型组织对‘忠诚’多少有些顾虑,”OpenRouter的数据分析负责人贾斯汀·萨默维尔说,“谁知道三周后最好的模型会是哪个?”

Cade Metz撰写有关人工智能、无人驾驶汽车、机器人、虚拟现实和其他技术新兴领域的新闻。

Karen Weise常驻西雅图,为时报撰写科技新闻。她主要关注美国两大科技公司亚马逊和微软的新闻。

Meaghan Tobin是时报科技记者,常驻台北,报道亚洲地区的商业和科技新闻,重点关注中国。

用户发布内容分享,若违规侵权,请联系我们核实删除

User-generated content. For violations or DMCA, contact us for removal

收藏 礼物
评论列表 查看 2 条评论