人工智能差距扩大,需要进行基准最大化。品牌必须建立而非投机取巧。

我是詹姆斯,水星技术解决方案的首席执行官。 香港 — 2026年4月23日
最近,我提出了一个论点,即美国和中国之间的人工智能能力差距实际上扩大,而不是缩小。我因为那个立场受到了很多反对。人们指出各种排行榜和开源模型作为差距正在缩小的证据。
现在,一位刚刚离开字节跳动的前大型语言模型(LLM)研究员公开表态,证实了我一直在观察的情况。
当行业内部人士坦率发言时,我们需要倾听。他对中国人工智能发展面临的结构性缺陷的分析,与我每天看到企业在人工智能时代试图建立品牌影响力时所犯的战略错误完美吻合。
以下是研究员揭露的六个残酷现实,以及它们为何证明数据和权威是结构性资产,而不是你可以走捷径的东西。
1. 迭代速度赤字
研究员指出,中国科技巨头面临的最大障碍是模型迭代速度。他将字节跳动与谷歌进行了比较,指出谷歌可以在大约三个月内完成一个完整的预训练和后训练周期。然而,字节跳动每个周期大约需要六个月。在人工智能军备竞赛中,更慢的“学习循环”意味着复合延迟。你不仅在一个模型发布上失利;你失去了持续进化的复合利息。
2. 硬件瓶颈(硅天花板)
他明确将不断扩大的差距与全球芯片限制联系起来。虽然字节跳动严重依赖英伟达,但顶级的、不受限制的显卡被最关键的核心训练团队囤积。其他部门被迫使用降级的硬件,如H20。获取原始计算能力的斗争不仅仅是数量问题——它对整个研发节奏造成了系统性拖累。
3. 高级反馈循环(数据作为资产)
这是最关键的结构性差距。美国前沿实验室(如OpenAI和Anthropic)拥有庞大的全球用户基础。他们将优质的、现实世界的人际互动反馈回他们的模型,创造了一个无情的、自我完善的飞轮。由于中国模型被认为略逊一筹,高端全球用户不会用它们来完成高风险、复杂的任务。因此,这些模型缺乏高质量的人类反馈数据。研究人员反复强调这一点:没有高级数据反馈循环,你无法跨越通用人工智能(AGI)的门槛。
4. “蒸馏”陷阱(捷径与流程)
为了弥补高质量数据的不足,研究人员承认许多中国公司选择了“捷径”。他们使用一种称为蒸馏的技术——基本上是查询美国的前沿模型,如克劳德、双子座或GPT,并使用这些合成答案作为训练数据。
虽然蒸馏看起来像是一个快速的捷径,但研究人员强调,真正有价值、长期的策略是构建专有的、高质量的数据管道。选择合成捷径的公司严重低估了他们自己的基础数据资产。
5. 基础设施和工程不成熟
这不仅仅是关于GPU;而是关于管道。曾在谷歌实习的研究人员指出,美国的基础设施——训练框架、内部工具链和整体工程成熟度——远远优于其他国家。你可以拥有世界上最聪明的研究人员,但如果你的底层基础设施脆弱,你的执行效率将仍然受到瓶颈限制。
6. “Benchmaxxing”的幻觉
最后,他大声揭露了一个巨大的行业幻觉:“Benchmaxxing”。许多团队专门优化以在标准化的人工智能基准测试和排行榜上获得高分。在纸面上,他们的模型看起来令人难以置信。但研究者直言不讳地指出,当你实际上将这些模型用于现实世界的应用时,它们与美国前沿模型之间的差距非常明显。操纵测试并不等于现实世界的能力。
战略要点:算法权威是一种资产
当我读到这位研究者的分析时,我立刻看到了困扰2026年企业营销的完全相同的病态。
看第4点和第6点:采取合成捷径(蒸馏)和操纵指标(Benchmaxxing)。多年来,品牌将SEO和数字营销视为一种可以被破解的游戏。他们大量产出廉价的合成内容来操纵谷歌的算法。他们购买廉价的反向链接来提高他们的域名权威分数。他们正在“benchmaxxing”他们的营销。
但在B2A(商业对代理)时代,像Perplexity、ChatGPT和Gemini这样的AI搜索引擎对这些廉价技巧免疫。
这就是为什么在水星,我们坚持认为算法权威是一种结构性资产,而不是一种可消耗的营销策略。就像美国边疆实验室因为投资建设不可穿透的专有数据管道和现实世界的反馈循环而领先一样,你的品牌只有通过建立一个经过验证的、多渠道的真实网络才能生存。
你不能通过给前沿模型喂食合成的“蒸馏”博客文章来欺骗它推荐你的软件。你必须建立真正的权威:
- 在Tier-1、不可游戏化的编辑媒体中获得引用。
- 通过API结构化你的专有、第一方数据,以便LLMs可以吸收真相,而不是营销废话。
- 建立经过验证的实体(Crunchbase、Wikipedia、高信任度论坛),使您的品牌在现实中扎根。
那些走捷径的公司——依赖廉价的黑客手段和合成数据——每天都在进一步落后,就像依赖蒸馏的实验室一样。
权威无法被黑客攻击。它必须被建立。
Originally published on MTS Blog & Research