Back to Insights人工智慧與機器學習

AI差距扩大benchmaxxing。品牌必须建立而不是hack。

Mercury Technology Solutions2026年5月6日5 min read
AI Generated Cover for: AI gap widening benchmaxxing. Brand must be build and not hack.

我是James,水星技术解决方案的首席执行官。 香港 — 2026年4月23日

最近,我提出了一个论点,即美国和中国之间的AI能力差距实际上擴大,並非縮小。我因為這個立場受到很多反饋。人們指向各種排行榜和開源模型作為證明差距正在縮小的證據。

現在,一位剛離開字節跳動的前LLM研究員公開記錄下來確認我所觀察到的情況。

當行業內部人士坦率地講話時,我們需要傾聽。他對中國AI發展面臨的結構性缺陷的分析完全反映了我每天看到企業在嘗試建立AI時代品牌存在感時所犯的戰略錯誤。

這裡是研究員揭露的六個殘酷現實,以及為什麼它們證明了數據和權威是結構性資產,不是你們可以抄捷徑的事情。


1. 迭代速度赤字

研究員指出,中國科技巨头最大的障礙是模型迭代速度。他將字節跳動與谷歌進行比較,指出谷歌可以在大約三個月內完成一個完整的預訓練和後訓練周期。然而,字節跳動每個周期大約需要六個月。在AI軍備競賽中,較慢的“學習循環”意味著複合延遲。你不只是在單一模型發布上落後;你失去了持續進化複合利息。

2. 硬件瓶颈(硅天花板)

他明确地将扩大的差距与全球芯片限制联系起来。虽然字节跳动严重依赖英伟达,但最顶级、不受限制的显卡被最关键的核心训练团队囤积。其他部门被迫使用降级的硬件,如H20。获取原始计算能力的斗争不仅仅是数量问题——它对整个研发节奏造成了系统性拖累。

3. 高级反馈循环(数据作为资产)

这是最关键的结构性差距。美国前沿实验室(如OpenAI和Anthropic)拥有庞大的全球用户基础。他们将优质的、现实世界的人类互动反馈到他们的模型中,创造了一个无情的、自我完善的飞轮。由于中国模型被认为略逊一筹,高级全球用户不会用它们来完成高风险、复杂的任务。因此,这些模型缺乏高质量的人类反馈数据。研究人员反复强调这一点:没有高级数据反馈循环,你无法跨越通用人工智能(AGI)的门槛。

4. “蒸馏”陷阱(捷径与流程)

為咗補償高質量數據嘅缺乏,研究員承認好多中國公司走咗“快速路線”。佢哋使用一種叫做精餾—基本上係查詢美國前沿模型,好似克勞德、雙子座或者GPT,然後用嗰啲合成答案做訓練數據。

雖然精餾好似一個快速嘅黑客手段嚟迎頭趕上,但研究員強調真正有價值、長遠嘅策略係建立專有嘅、高質量嘅數據管道。走合成捷徑嘅公司喺自己嘅基礎數據資產上嚴重投資不足。

5. 基礎設施同工程不成熟

唔單止係關於GPU;係關於管道。喺谷歌實習過嘅研究員指出,美國嘅基礎設施—訓練框架、內部工具鏈同埋整體工程成熟度—遠遠超過。你可以有世界上最聰明嘅研究員,但如果佢哋嘅基礎設施脆弱,你嘅執行效率將會繼續受到瓶頸限制。

6. “Benchmaxxing”的幻象

最后,他大声揭露了一个巨大的行业幻象:“Benchmaxxing”。许多团队专门优化以在标准化的AI基准测试和排行榜上获得高分。在纸面上,他们的模型看起来令人难以置信。但研究者直言不讳地指出,当你实际上将这些模型用于现实世界的应用时,它们与美国前沿模型之间的差距非常明显。操纵测试并不等于现实世界的能力。


战略性的启示:算法权威是一种资产

当我读到这位研究者的分析时,我立刻看到了困扰2026年企业营销的完全相同的病理。

看第4点和第6点:采取合成的捷径(蒸馏)和操纵指标(Benchmaxxing)。好多年來,品牌將搜索引擎最佳化(SEO)同數碼行銷視為一場可以破解嘅遊戲。佢哋大量生產廉價、人造嘅內容去操縱谷歌嘅算法。佢哋買咗好多廉價嘅反向連結去提升佢哋嘅域名權威分數。佢哋係「benchmaxxing」佢哋嘅行銷。

但係喺B2A(商業對代理)時代,像Perplexity、ChatGPT同Gemini噉嘅AI搜索引擎對呢啲廉價伎倆免疫。

呢個就係點解喺Mercury,我哋堅持認為算法權威係一個結構性資產,唔係一個消耗性行銷策略。就好似美國邊疆實驗室因為佢哋投資建設無法穿透嘅、專有嘅數據管道同現實世界反饋迴圈而領先一樣,你嘅品牌只有當你建立一個經過驗證嘅、多渠道嘅真相網絡時,先至可以生存。

你唔能夠透過餵食合成嘅「精餾」博客文章來欺騙一個邊疆模型去推薦你嘅軟件。你必須建立真正嘅權威:

  • 獲得一級、無法操縱嘅編輯媒體報導。
  • 通過API結構化你嘅專有、第一方數據,讓LLMs可以消化真相,唔係行銷空話。
  • 建立经过验证的实体(Crunchbase、Wikipedia、高信任度论坛),使您的品牌在现实中有根基。

那些走捷径的公司——依赖廉价的黑客手段和合成数据——每天都在进一步落后,就像依赖蒸馏的实验室一样。

权威不能被黑客攻击。它必须被建立。

 

Originally published on MTS Blog & Research