ビッグテックがAI支出を削減：財政的モンスター

昨年、ビジネスの物語はシンプルでした：できるだけ早くAIを従業員の手に届けること。競争は始まりました。ツールは魔法のようでした。未来は今ここにありました。

しかし最近、取締役会に大きな変化が訪れました。ハネムーンは正式に終わりました。そして、請求書が届きました。

最近の報告によると、アマゾン、ウォルマート、シスコ、ウーバー、メタなどの早期採用者は、内部のAI使用を積極的に制限しています。技術が失敗したからではありません。彼らはサーバーの請求書を見て、偶然にも財政的モンスターを作り出してしまったことに気づいたのです。

私たちが企業のデジタルトランスフォーメーションを支援する際、デジタルトランスフォーメーションの重要性を理解することが不可欠です。なぜこれが起こっているのか、そしてトークントラップを避ける方法を理解することが重要です。 トークントラップ。

エージェントの台頭（そして定額料金請求の終焉）

しばらくの間、私たちはAIを安価、あるいは無料だと考えるように訓練されてきました。しかし、計算は決して無料ではありません。

初期コストは定額制のサブスクリプションモデルによって補助されていました。月に20ドルを支払うと、最前線のモデルに無制限にアクセスできるというものでした。それはお得に感じられました。しかし、OpenAIやAnthropicのようなAIラボが使用量に基づく トークンごとの請求に移行するにつれて、人工知能の真のコストが明らかになっています。

トークンとは、未経験者にとっては、AIモデルによって処理されるデータの基本単位です。あなたが送るすべての言葉、受け取るすべての言葉、その間のすべての推論ステップ—トークンです。そして、それはすぐに積み重なります。

この請求の変化は、技術の進化と同時に起こりました：チャットボットからAIエージェントへの飛躍です。

チャットボットはあなたのプロンプトを待ち、応答し、そして眠ります。AIエージェントは自律的です。ループします。推論します。複雑なワークフローを実行し、他のエージェントをトリガーします。シスコの最高製品責任者ジートゥ・パテルが指摘したように、エージェントを展開するには、指数関数的に多くのインフラが必要です。すべての人間の従業員が突然、10、100、あるいは1000のAIエージェントが背景で休むことなく働いている状況になるかもしれません。

コンピュートの消耗は驚異的です。

企業の現実チェック：2026年の予算を4月までに燃やす

技術が道具ではなくおもちゃになると、予算は消えてしまいます。

取る ワーカート 、AIの利用が広がるのを見たソフトウェア会社 「火のように」 1,300人の従業員の間で。アンソロピックが5月にトークンごとの課金に切り替えたとき、ワーカートのコストは 初日から7倍に急増しました。 彼らのCIOの反応は？ 「なんてこった、私たちはモンスターを作ってしまった。」

ウーバー は同様の危機に直面しました。彼らのCOOは、実際の消費者向け機能の成果に対して巨額のトークン支出を正当化することが不可能になりつつあると認めました。状況は手に負えなくなり、ウーバーは今年の4月までに2026年のAI予算をすべて使い果たしてしまいました。現在、彼らは個々の従業員のトークン支出を月額1,500ドルに制限しています。

で アマゾン は、エンジニアたちが内部の生産性リーダーボードを登るためだけにエージェントを構築していました。経営陣は介入し、チームに「 AIのためのAIを使うのをやめるように」と明示的に警告しなければなりませんでした。

パターンは明確です。制御されていないAIの採用とトークンごとの請求、そして自律エージェントの組み合わせは、測定可能なリターンを上回るコストの爆発を引き起こします。

ライフハック：AIの財務責任及びモデルルーティング

では、これはAI革命が停滞しているということですか？全く違います。それは業界が成熟していることを意味します。私たちは AIの財務責任 の時代に入っています。

AIを統合しているビジネスリーダーの皆様、IT部門を破産させないためのプレイブックをご紹介します。

1. 食料品店に行くためにフェラーリを使うのをやめましょう

あなたは、すべてのタスクに対して、最新の最も高価なフロンティアモデル—GPT-4o、Claude 3.5 Sonnet、または今週の最先端の何か—を必要としません。

ハック：モデルルーティングを実装する。タスクの適合性と目的を評価する。もし従業員が基本的なメールを要約している場合、そのクエリを古い安価なモデルにルーティングする。複雑なコーディング、深い戦略的推論、または高リスクのクリエイティブな作業にはプレミアムトークンを節約する。馬力を高速道路に合わせる。

2. ローカルおよびオープンソースモデルを活用する

大規模なクラウドAIの請求書を削減するために、企業は従業員に会社のサーバー上または従業員のデバイス上で直接動作するオープンソースモデルを使用するよう求めることが増えている。インフラを制御すれば、第三者のラボにトークン料金を支払う必要がなくなる。初期のセットアップコストは現実的だが、長期的な節約は大きい。

3. グローバル市場を注視する

データによると、中国のAIラボは現在、米国の同業者よりもかなり低価格でトークンを提供しており、これは安価なエネルギーと非常に効率的なモデルによるものだ。このコスト優位性は、トークン消費量の大幅な増加をもたらしている。テクノロジースタックを構築する際には、グローバルな価格動向に注目することが重要だ。最も安いトークンが必ずしも最良のトークンとは限らないが、市場の動向を知っておく価値はある。

デジタリティを加速し、持続可能に

結局のところ、真のデジタルトランスフォーメーションは盲目的な採用ではありません。最先端の技術を実際のビジネス効率に合わせることが重要です。

取り残されることへの恐れから、チームに無制限の計算能力を与えるようなことはしないでください。ROIを定義しましょう。モデルをタスクに合わせてください。技術スタックに対して厳格なガバナンスを維持しましょう。

AI革命は減速していません。むしろ成長しています。そして成長することは、予算内で生活することを学ぶことを意味します。

トレンドの先を行き、予算内に収めましょう。

— ジェームズ

「私たちはモンスターを作り出した」：ビッグテックがAI投資を抑制する理由