科技与自然
·
BBC/德国之声
·
2026-04-24 06:33

DeepSeek再扔“王炸” 美国指责“蒸馏”窃技术 中国反驳

中国人工智能公司深度求索(DeepSeek)4月24日发布外界关注已久的新版本DeepSeek-V4并开源,华为云首发适配。

去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智能初创公司深度求索 (DeepSeek) 于本周五(4月24日)发布了备受期待的新模型预览版DeepSeek-V4。该模型专为华为芯片技术进行了适配,在研发过程中与华为紧密合作,与此前DeepSeek依赖英伟达芯片的做法形成对比,不过DeepSeek未透露训练起最新模型具体使用了哪些处理器。DeepSeek表示,新模型的专业版在世界知识基准测试中表现优于其他开源模型,仅次于谷歌的 Gemini-Pro-3.1,而后者是一款闭源模型(即核心技术不公开的模型)。DeepSeek-V4 还提供了一个成本更低的闪速版 (flash version)。预览版允许公司在正式产品发布前整合现实世界的反馈并进行调整。该模型预计定型的最终时间表尚未公开。

美国目前仍是最创新、最盈利的AI公司云集的国家,中国本土的人工智能公司发展也异常迅速。美中在这一领域竞争激烈。图像来源: Jaque Silva/NurPhoto/picture allianceDeepSeek

处于中美AI较量的“浪尖”此次预览版发布的前一天,美国白宫指责中国大规模窃取美国人工智能实验室的知识产权。这一指责正逢特朗普下个月访华前夕,可能导致中美双方关系更加紧张。

中国驻华盛顿大使馆表示反对“这些毫无根据的指责”,并补充说,中国政府“高度重视知识产权保护”。

DeepSeek横空出世以来一直备受关注,也饱受争议。华盛顿指责其通过获取尖端的英伟达芯片来训练模型,违反了美国的出口管制。Anthropic和OpenAI 两家美国公司也指责DeepSeek使用了“蒸馏”等不当手法,利用了它们的专利模型(“蒸馏”指通过模仿大模型的输出结果来训练一个小模型的技术)。

总部位于杭州的DeepSeek承认使用了英伟达芯片,但未就这些特定芯片是否属于出口禁令范围发表评论。该公司曾表示,其V3模型使用的是通过“网络爬虫”(web crawling)自动检索和收集的自然数据,并未使用由OpenAI生成的合成数据。

强强联手 紧密合作华为的升腾 (Ascend) 人工智能芯片系列是中国减少对美国尖端半导体技术依赖的关键。华为周五表示,公司与DeepSeek密切合作,使新的 V4 模型能够在华为的全线高性能系统上运行。

华为表示:“整个升腾超级节点产品线现在都支持DeepSeek-V4 系列模型。”

华盛顿自 2022 年开始限制中国获取美国公司制造的高端人工智能芯片。此后,中国加速推进技术自主,这对像华为这样的中国芯片制造商来说无疑是一个利好局面。

DeepSeek在 2025 年初的飞速崛起,也将低成本、开源模型推向了中国人工智能生态系统的前沿,刺激了一批中国本土竞争对手的涌现。不过DeepSeek-V4大招一出,智谱AI股价周五当天下跌了9%, 名之梦下跌了7%。

据《信息报》(The Information) 本月的一份报告显示,由中国幻方量化 (High-Flyer Capital Management) 控股的DeepSeek目标是以超过200亿美元的估值进行融资。报告还指出,科技巨头阿里巴巴和腾讯正在商讨入股事宜。

相关报道:白宫备忘录指中国公司通过“蒸馏”活动大规模窃取美国AI技术

克拉西奥斯在备忘录中指出,这些行为的目的是“系统性地削弱美国的研发能力并获取专有资讯”。

白宫表示,将与美国人工智慧(AI)公司更紧密合作,以打击外国势力进行的“工业规模活动”,这些势力试图窃取该技术的进展。

白宫科技政策办公室主任迈克尔·克拉西奥斯(Michael Kratsios)在一份内部备忘录中写道,政府掌握新资讯显示“主要来自中国的外国实体”正在剥削美国企业。

他表示,透过一种称为“蒸馏”(distilling)的程序,这些实体基本上是在复制美国公司所开发的AI技术。

对此,中国驻美大使馆一位代表在华盛顿表示,中国的发展“是其自身努力和奉献以及国际合作的结果”。

不过,克拉西奥斯在备忘录中指出,这些行为的目的是“系统性地削弱美国的研发能力并获取专有资讯”。

为了避免并制止这种“恶意利用”,他表示白宫将采取四项措施:

向美国AI公司分享更多有关蒸馏行动中“采用的策略与涉案行为者”的资讯与公司“更好协调”以共同抵御这些攻击制定一套“识别、减轻及修复”这类攻击的最佳实务“探索”白宫如何追究对此类蒸馏行为负责的外国行为者

备忘录未详述对被发现从事美国AI技术蒸馏的外国实体将采取的具体行动计划。

中国驻美使馆代表在回应该备忘录时,对“美国对中国企业的不合理打压”提出异议。

该代表补充说:“中国不仅是全球工厂,也正成为全球创新实验室。”

“中国的发展来自自身的投入与努力,以及提供互利成果的国际合作。”

所谓的“蒸馏”活动通常来自一些公司。这些公司往往会针对特定的AI聊天机器人或工具,运作数以千计的个人帐号,使其看起来就像一般使用者。

随后,这些帐号会采取更为协调一致的方式,尝试“越狱”(jailbreak)或以其他途径揭露不应对外公开的AI模型相关资讯。这些资讯会被保存下来,并用于他们自身的 AI 模型研发与训练。

DeepSeek的关键特点在于,它在当时展现出的能力与美国的OpenAI、Anthropic等模型相近,但训练所使用的电脑晶片量却少得多。

“随着用于侦测与缓解工业规模蒸馏的方法日益变得更精密,若以这种脆弱基础来建立AI能力的外国实体,对其所产出的模型之完整性与可靠性应该缺乏信心。”克拉西奥斯表示。

事实上,尽管克拉西奥斯未点名任何外国实体,但包括OpenAI、Anthropic等领先的AI 公司都表示,他们正在面对此类蒸馏活动。

今年稍早,Anthropic曾描述三家AI实验室的蒸馏“攻击”——DeepSeek、Moonshot 与MiniMax——并称其已发现,这些实验室都在透过蒸馏活动,努力复制Anthropic的模型。这三家实验室均位于中国。

OpenAI也指控DeepSeek复制其技术。

DeepSeek、Moonshot与MiniMax尚未立即回应BBC的置评请求。

DeepSeek于去年初出现在市场上,并很快成为使用者欢迎的AI模型与聊天机器人之一。该公司当时表示,制作该模型只需花费数百万美元,仅为其他AI公司在打造模型与工具上所投入的数千亿美元支出的一小部分。

上个月,DeepSeek的聊天机器人遭遇重大中断事故。预期它将很快发布其AI模型的新版本。

美国总统特朗普(Donald Trump,川普)预计将在5月访问中国。

用户发布内容分享,若违规侵权,请联系我们核实删除

User-generated content. For violations, contact us for removal

收藏 礼物
评论列表 查看 6 条评论