「我們創造了一個怪物」:為什麼大型科技公司正在減少對人工智慧的支出

在過去一年中,商業敘事很簡單:儘快將人工智慧交到員工手中。競賽已經開始。這些工具是神奇的。未來就是現在。
但最近,董事會發生了巨大的變化。蜜月期正式結束。帳單已經來了。
根據最近的報導,像亞馬遜、沃爾瑪、思科、優步和Meta等早期採用者正在積極限制內部人工智慧的使用。不是因為技術失敗,而是因為他們查看了伺服器帳單,意識到自己不小心創造了一個財務怪物。
當我們協助企業應對 數位轉型 時,瞭解這一現象發生的原因以及如何避免 代幣陷阱 是至關重要的。
代理人的崛起(以及固定費率計費的消亡)
一段時間以來,我們都被訓練成將人工智慧視為便宜,甚至是免費的。但計算從來不是免費的。
最初的成本是由固定費率訂閱模式補貼的。你每個月支付二十美元,就可以無限制地訪問前沿模型。這感覺像是一個划算的交易。但隨著像 OpenAI 和 Anthropic 這樣的人工智慧實驗室轉向基於使用量的 每代幣計費人工智慧的真正成本正在被揭示出來。
對於不熟悉的人來說,標記是人工智慧模型處理的基本資料單位。你發送的每一個字、你接收的每一個字、之間的每一個推理步驟——都是標記。而且它們累積得非常快。
這一計費轉變與技術演進同時發生:從聊天機器人到人工智慧代理。
聊天機器人等待你的提示,回答後就會進入休眠狀態。人工智慧代理是自主的。它會循環運作。它進行推理。它執行複雜的工作流程並觸發其他代理。正如思科的首席產品官Jeetu Patel所指出的,部署代理需要指數級的基礎設施。每一位人類員工可能突然會有十個、一百個,甚至一千個人工智慧代理在背後不知疲倦地工作。
計算資源的消耗令人震驚。
企業現實檢查:在四月之前燒掉2026年的預算
當科技變成玩具而非工具時,預算就會蒸發。
拿 Workato ,這是一家看到人工智慧使用迅速擴散的軟體公司 「如野火般」 在其1,300名員工之中。當Anthropic在五月轉為按字元計費時,Workato的成本在第一天就激增了 7倍。 他們的首席資訊官的反應是? 「天啊,我們造了一個怪物。」
Uber 面臨類似的危機。他們的首席營運官承認,將巨額的代幣支出與實際的消費者功能產出進行合理化變得不可能。情況失控,以至於Uber在今年四月之前就已經耗盡了其整個2026年的人工智慧預算。他們現在將每位員工的代幣支出上限設為每月1,500美元。
在 亞馬遜 ,工程師們正在建立代理人,只為了在內部生產力排行榜上爬升。管理層不得不介入,明確警告團隊停止使用 「為了人工智慧而進行人工智慧。」
這個模式很明顯。未經控制的人工智慧採用,加上按代幣計費和自主代理人,造成了成本爆炸,超過了任何可衡量的回報。
生活竅門:AI 財務責任 及模型路由
那麼這是否意味著 AI 革命正在停滯不前?絕對不是。這意味著產業正在成熟。我們正進入 AI 財務責任 的時代。
如果您是一位整合 AI 的商業領袖,這裡有您的行動手冊,以避免讓您的 IT 部門破產。
1. 停止用法拉利去雜貨店
您不需要每一項任務都使用最昂貴的前沿模型—GPT-4o、Claude 3.5 Sonnet,或本週的任何尖端技術。
這個黑客技巧:實施模型路由。評估任務的適合度和目的。如果員工正在總結一封基本的電子郵件,將該查詢路由到一個較舊、較便宜的模型。將高級的代幣保留給複雜的編碼、深度的戰略推理或高風險的創意工作。將馬力與高速公路匹配。
利用本地和開源模型
為了減少龐大的雲端人工智慧帳單,公司越來越多地要求員工使用在公司伺服器或直接在員工設備上運行的開源模型。如果你控制基礎設施,就可以停止向第三方實驗室支付代幣費用。前期的設置成本是真實的,但長期的節省是可觀的。
觀察全球市場
數據顯示,中國的人工智慧實驗室目前提供的代幣價格顯著低於美國的對應實驗室,這是由於較便宜的能源和高效的模型所驅動。這一成本優勢使他們的代幣消耗量大幅上升。在建立你的技術堆疊時,留意全球定價動態。最便宜的代幣不一定是最好的代幣,但瞭解市場的走向是值得的。
可持續地加速數位化
到頭來,真正的數位轉型 並不是盲目採用。它是關於將尖端科技與實際商業效率對齊。
不要讓錯失恐懼驅使你給你的團隊一張空白支票來獲取計算能力。定義投資報酬率。將模型與任務匹配。對你的技術堆疊保持嚴格的治理。
人工智慧革命並沒有放緩。它只是正在成熟。而成熟意味著學會在預算內生活。
保持領先於趨勢—並且控制預算。
— 詹姆斯
Originally published on MTS Blog & Research