科技与自然

BBC/德国之声

2026-04-24 06:33

DeepSeek再扔“王炸” 美国指责“蒸馏”窃技术中国反驳

中国人工智能公司深度求索（DeepSeek）4月24日发布外界关注已久的新版本DeepSeek-V4并开源，华为云首发适配。

去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智能初创公司深度求索 (DeepSeek) 于本周五（4月24日）发布了备受期待的新模型预览版DeepSeek-V4。该模型专为华为芯片技术进行了适配，在研发过程中与华为紧密合作，与此前DeepSeek依赖英伟达芯片的做法形成对比，不过DeepSeek未透露训练起最新模型具体使用了哪些处理器。DeepSeek表示，新模型的专业版在世界知识基准测试中表现优于其他开源模型，仅次于谷歌的 Gemini-Pro-3.1，而后者是一款闭源模型（即核心技术不公开的模型）。DeepSeek-V4 还提供了一个成本更低的闪速版 (flash version)。预览版允许公司在正式产品发布前整合现实世界的反馈并进行调整。该模型预计定型的最终时间表尚未公开。

美国目前仍是最创新、最盈利的AI公司云集的国家，中国本土的人工智能公司发展也异常迅速。美中在这一领域竞争激烈。图像来源: Jaque Silva/NurPhoto/picture allianceDeepSeek

处于中美AI较量的“浪尖”此次预览版发布的前一天，美国白宫指责中国大规模窃取美国人工智能实验室的知识产权。这一指责正逢特朗普下个月访华前夕，可能导致中美双方关系更加紧张。

中国驻华盛顿大使馆表示反对“这些毫无根据的指责”，并补充说，中国政府“高度重视知识产权保护”。

DeepSeek横空出世以来一直备受关注，也饱受争议。华盛顿指责其通过获取尖端的英伟达芯片来训练模型，违反了美国的出口管制。Anthropic和OpenAI 两家美国公司也指责DeepSeek使用了“蒸馏”等不当手法，利用了它们的专利模型（“蒸馏”指通过模仿大模型的输出结果来训练一个小模型的技术）。

总部位于杭州的DeepSeek承认使用了英伟达芯片，但未就这些特定芯片是否属于出口禁令范围发表评论。该公司曾表示，其V3模型使用的是通过“网络爬虫”（web crawling）自动检索和收集的自然数据，并未使用由OpenAI生成的合成数据。

强强联手紧密合作华为的升腾 (Ascend) 人工智能芯片系列是中国减少对美国尖端半导体技术依赖的关键。华为周五表示，公司与DeepSeek密切合作，使新的 V4 模型能够在华为的全线高性能系统上运行。

华为表示：“整个升腾超级节点产品线现在都支持DeepSeek-V4 系列模型。”

华盛顿自 2022 年开始限制中国获取美国公司制造的高端人工智能芯片。此后，中国加速推进技术自主，这对像华为这样的中国芯片制造商来说无疑是一个利好局面。

DeepSeek在 2025 年初的飞速崛起，也将低成本、开源模型推向了中国人工智能生态系统的前沿，刺激了一批中国本土竞争对手的涌现。不过DeepSeek-V4大招一出，智谱AI股价周五当天下跌了9%, 名之梦下跌了7%。

据《信息报》(The Information) 本月的一份报告显示，由中国幻方量化 (High-Flyer Capital Management) 控股的DeepSeek目标是以超过200亿美元的估值进行融资。报告还指出，科技巨头阿里巴巴和腾讯正在商讨入股事宜。

相关报道：白宫备忘录指中国公司通过“蒸馏”活动大规模窃取美国AI技术

克拉西奥斯在备忘录中指出，这些行为的目的是“系统性地削弱美国的研发能力并获取专有资讯”。

白宫表示，将与美国人工智慧（AI）公司更紧密合作，以打击外国势力进行的“工业规模活动”，这些势力试图窃取该技术的进展。

白宫科技政策办公室主任迈克尔·克拉西奥斯（Michael Kratsios）在一份内部备忘录中写道，政府掌握新资讯显示“主要来自中国的外国实体”正在剥削美国企业。

他表示，透过一种称为“蒸馏”（distilling）的程序，这些实体基本上是在复制美国公司所开发的AI技术。

对此，中国驻美大使馆一位代表在华盛顿表示，中国的发展“是其自身努力和奉献以及国际合作的结果”。

不过，克拉西奥斯在备忘录中指出，这些行为的目的是“系统性地削弱美国的研发能力并获取专有资讯”。

为了避免并制止这种“恶意利用”，他表示白宫将采取四项措施：

向美国AI公司分享更多有关蒸馏行动中“采用的策略与涉案行为者”的资讯与公司“更好协调”以共同抵御这些攻击制定一套“识别、减轻及修复”这类攻击的最佳实务“探索”白宫如何追究对此类蒸馏行为负责的外国行为者

备忘录未详述对被发现从事美国AI技术蒸馏的外国实体将采取的具体行动计划。

中国驻美使馆代表在回应该备忘录时，对“美国对中国企业的不合理打压”提出异议。

该代表补充说：“中国不仅是全球工厂，也正成为全球创新实验室。”

“中国的发展来自自身的投入与努力，以及提供互利成果的国际合作。”

所谓的“蒸馏”活动通常来自一些公司。这些公司往往会针对特定的AI聊天机器人或工具，运作数以千计的个人帐号，使其看起来就像一般使用者。

随后，这些帐号会采取更为协调一致的方式，尝试“越狱”（jailbreak）或以其他途径揭露不应对外公开的AI模型相关资讯。这些资讯会被保存下来，并用于他们自身的 AI 模型研发与训练。

DeepSeek的关键特点在于，它在当时展现出的能力与美国的OpenAI、Anthropic等模型相近，但训练所使用的电脑晶片量却少得多。

“随着用于侦测与缓解工业规模蒸馏的方法日益变得更精密，若以这种脆弱基础来建立AI能力的外国实体，对其所产出的模型之完整性与可靠性应该缺乏信心。”克拉西奥斯表示。

事实上，尽管克拉西奥斯未点名任何外国实体，但包括OpenAI、Anthropic等领先的AI 公司都表示，他们正在面对此类蒸馏活动。

今年稍早，Anthropic曾描述三家AI实验室的蒸馏“攻击”——DeepSeek、Moonshot 与MiniMax——并称其已发现，这些实验室都在透过蒸馏活动，努力复制Anthropic的模型。这三家实验室均位于中国。

OpenAI也指控DeepSeek复制其技术。

DeepSeek、Moonshot与MiniMax尚未立即回应BBC的置评请求。

DeepSeek于去年初出现在市场上，并很快成为使用者欢迎的AI模型与聊天机器人之一。该公司当时表示，制作该模型只需花费数百万美元，仅为其他AI公司在打造模型与工具上所投入的数千亿美元支出的一小部分。

上个月，DeepSeek的聊天机器人遭遇重大中断事故。预期它将很快发布其AI模型的新版本。

美国总统特朗普（Donald Trump，川普）预计将在5月访问中国。

用户发布内容分享，若违规侵权，请联系我们核实删除

User-generated content. For violations, contact us for removal

收藏礼物

评论列表查看 6 条评论

DeepSeek再扔“王炸” 美国指责“蒸馏”窃技术 中国反驳

好评推荐 Top rated

登录账号

DeepSeek再扔“王炸” 美国指责“蒸馏”窃技术中国反驳