Back to Insights人工智能应用

100万亿个令牌无法撒谎:你们一半在编码,另一半在角色扮演

Mercury Technology Solutions2025年12月25日5 min read

简而言之:OpenRouter的最新报告分析了100万亿个数据令牌,揭示了人工智能使用的奇怪分裂:世界上50%的人在使用人工智能编写代码,而另一半则在用于角色扮演和创意小说。传统任务如“写电子邮件”现在已成为少数。报告还强调了中国开源模型(如DeepSeek)的爆炸性增长,并证明用户忠诚度与价格关系不大,而更多地与“灰姑娘效应”有关。以下是人工智能革命前线的六个关键见解。

我是Mercury Technology Solutions的首席执行官James。

你是否曾经想过其他人实际上在用人工智能做什么?答案不是“写电子邮件”或“总结会议”。答案是:世界的一半在构建软件,另一半在构建幻想世界。

这不是玩笑。这是OpenRouter分析100万亿个使用数据的36页报告得出的结论。OpenRouter是人工智能模型的“超市”——一个用户可以随意在ChatGPT、Claude、Gemini和DeepSeek之间切换的平台。他们的数据提供了全球人工智能行为的罕见、未经过滤的视角。

以下是六个重要的见解。

1. 大分裂:编码者与梦想者在2025年初,编码任务占使用的11%。到2025年末,这个数字激增至超过50%。与此同时,创意应用——角色扮演(RP)、互动小说和游戏——也占据了开源模型使用的超过50%。

见解:

编码者:

编码任务的平均输入长度现在为20,000个令牌。这不是“给我写一个函数。”而是“这是我的整个代码库,修复架构。”人工智能已经从初级开发者晋升为高级工程师。

梦想者:

另一个巨大的部分是人们使用人工智能进行情感陪伴和互动叙事。为什么选择开源?因为用户希望拥有不受审查、可定制和高度响应的角色——这是企业模型(如GPT-4)通常会阻止的。

  • 2. 东方崛起:中国的开源激增在2024年末,中国开源模型占OpenRouter使用的1.2%。到2025年中,这个数字达到了30%。这不是营销。这是原始的技术能力。
  • DeepSeek以处理14.37万亿个令牌领先,几乎是OpenAI开源产品使用量的9倍。其次是Qwen(5.59T)。市场已经从美国垄断转向多极化世界。DeepSeek的主导地位(曾经占开源的>50%)已稀释至<25%,这不是因为它变得更糟,而是因为MiniMax和Kimi等竞争对手的崛起。蛋糕在变大。

3. “灰姑娘效应”:为什么你的第一个人工智能是你永远的人工智能

关于用户忠诚度有一个秘密:

它是粘性的。

早期采用者:

在2025年5月开始使用Claude Sonnet 3.5的用户,五个月后的保留率为40%。

后期采用者:

后来加入的用户保留率低于10%。

见解:第一个成功解决你关键问题的人工智能成为你的“灰姑娘的鞋子”。它完美契合。你围绕它的特点构建工作流程。即使后来出现了更好的模型,切换成本也会让人觉得太高。建议:不要仅仅选择你看到的第一个模型。广泛测试。你的第一个选择很可能会成为你的永久习惯。

  • 4. 价格无弹性:质量胜于成本这很反直觉:价格并不驱动使用。Claude Sonnet 3.5 in May 2025 had a 40% retention rate five months later.
  • Late Adopters: Users who joined later had retention rates below 10%.

The Insight: The first AI that successfully solves your critical problem becomes your "Cinderella's Slipper." It fits perfectly. You build your workflows around its quirks. Even if a better model comes out later, the switching cost feels too high.

Advice: Don't just pick the first model you see. Test widely. Your first choice will likely become your permanent habit.

4. Price Inelasticity: Quality Trumps Cost

This is counter-intuitive: Price does not drive usage.

价格下降10%仅带来0.5% - 0.7%的使用量增加。

  • Claude 3.5 诗歌:成本约为每百万个令牌3美元。它占据了60%的编码市场。
  • GPT-5 Pro:成本约为每百万个令牌35美元。人们仍然大量使用它。

洞察:如果你是一名开发者在修复一个关键错误,你并不在乎节省2美元。你关心的是答案是否正确。如果它给你错误的代码,“免费”就是昂贵的。

给领导者的建议:停止强迫你的团队使用便宜的劣质模型。给他们法拉利。生产力的提升远远超过订阅成本。

5. 从助手到合作者(上下文爆炸)

在20个月内:

  • 平均提示长度:1,500 --> 6,000+ 令牌(增加4倍)。
  • 平均输出长度:150 --> 400+ 令牌(增加3倍)。

我们不再问简单的问题。我们正在将整个项目上下文、战略文件和代码库倾倒到上下文窗口中。我们将AI作为一个合作者使用,而不仅仅是一个搜索引擎。

杰文斯悖论:随着AI变得更便宜、更聪明,我们并没有减少支出。我们在更难的问题上使用它更多,导致总成本上升。

6. 全球转变:亚洲正在支付更多

亚洲在AI支出中的份额从2025年的13%跃升至31%。

北美的份额首次降至50%以下。

语言统计:

  1. 英语:82.87%
  2. 简体中文:4.95%
  3. 俄语:2.47%

中文是全球AI互动中使用第二多的语言。这表明AI不再是“仅限西方”的游戏。预计未来的模型将大力优化中文语言性能。

结论:双重现实

数据描绘了我们新现实的迷人画面。

在一个屏幕上,一名开发者正在使用DeepSeek架构一个系统。

在另一个屏幕上,一名作家正在使用LLaMA创作一部奇幻小说。

AI同时是终极的生产力工具和终极的逃避幻想。

形势变化迅速。今天的领导者可能是明天的落后者。但对我们——用户而言——这场竞争是纯金。它意味着更好的工具,更多的选择,以及更多的权力掌握在我们手中。

水星科技解决方案:加速数字化。

Originally published on MTS Blog & Research