"Nous avons créé un monstre" : Pourquoi les grandes entreprises technologiques freinent leurs dépenses en IA

Au cours de l'année écoulée, le récit commercial était simple : mettre l'IA entre les mains de vos employés aussi vite que possible. La course était lancée. Les outils étaient magiques. L'avenir était maintenant.
Mais récemment, un changement massif a frappé la salle de conseil. La lune de miel est officiellement terminée. Et la facture est arrivée.
Selon des rapports récents, des adopteurs précoces comme Amazon, Walmart, Cisco, Uber et Meta restreignent activement l'utilisation interne de l'IA. Non pas parce que la technologie a échoué. Mais parce qu'ils ont regardé leurs factures de serveur et réalisé qu'ils avaient accidentellement créé un monstre financier.
Alors que nous aidons les entreprises à naviguer dans la transformation numérique , il est crucial de comprendre pourquoi cela se produit et comment éviter le piège des tokens.
L'essor des agents (et la mort de la facturation à tarif fixe)
Pendant un certain temps, nous avons tous été formés à considérer l'IA comme bon marché. Ou même gratuite. Mais le calcul n'est jamais gratuit.
Le coût initial était subventionné par des modèles d'abonnement à tarif fixe. Vous payiez vingt dollars par mois et aviez un accès illimité à un modèle de pointe. Cela semblait être une bonne affaire. Mais alors que des laboratoires d'IA comme OpenAI et Anthropic passent à une facturation basée sur l'utilisation par token., le véritable coût de l'intelligence artificielle se révèle.
Un jeton, pour les non-initiés, est l'unité de base de données traitée par un modèle d'IA. Chaque mot que vous envoyez, chaque mot que vous recevez, chaque étape de raisonnement entre les deux—des jetons. Et ils s'accumulent rapidement.
Ce changement de facturation coïncidait avec une évolution technologique : le saut des chatbots vers les Agents IA.
Un chatbot attend votre invite, répond, et s'endort. Un Agent IA est autonome. Il boucle. Il raisonne. Il exécute des flux de travail complexes et déclenche d'autres agents. Comme l'a noté Jeetu Patel, directeur produit de Cisco, déployer des agents nécessite une infrastructure exponentiellement plus importante. Chaque employé humain pourrait soudainement avoir dix, cent, ou même mille agents IA travaillant sans relâche en arrière-plan.
La consommation de calcul est stupéfiante.
La Réalité des Entreprises : Brûler le budget 2026 d'ici avril
Lorsque la technologie devient un jouet plutôt qu'un outil, les budgets s'évaporent.
Prenez Workato , une entreprise de logiciels qui a vu l'utilisation de l'IA se répandre "comme une traînée de poudre" parmi ses 1 300 employés. Lorsque Anthropic est passé à une facturation par jeton en mai, les coûts de Workato ont explosé 7 fois dès le premier jour. La réaction de leur CIO ? "Mon dieu, nous avons créé un monstre."
Uber a fait face à une crise similaire. Leur COO a admis qu'il devenait impossible de justifier les dépenses massives en tokens par rapport à la production réelle de fonctionnalités pour les consommateurs. La situation est devenue si incontrôlable qu'Uber avait épuisé tout son budget AI alloué pour 2026 d'ici avril de cette année. Ils ont maintenant plafonné les dépenses en tokens des employés individuels à 1 500 $ par mois.
À Amazon , des ingénieurs construisaient des agents juste pour gravir les classements de productivité internes. La direction a dû intervenir et avertir explicitement les équipes de cesser d'utiliser "l'IA pour le plaisir de l'IA."
Le schéma est clair. L'adoption de l'IA sans contrôle, combinée à la facturation par token et aux agents autonomes, crée une explosion de coûts qui dépasse tout retour mesurable.
Le Life Hack :Responsabilité financière de l'IA et routage des modèles
Cela signifie-t-il que la révolution de l'IA est en panne ? Absolument pas. Cela signifie que l'industrie est en train de mûrir. Nous entrons dans l'ère de Responsabilité financière de l'IA .
Si vous êtes un leader d'entreprise intégrant l'IA, voici votre guide pour éviter de faire faillite à votre département informatique.
1. Arrêtez d'utiliser une Ferrari pour aller au supermarché
Vous n'avez pas besoin du modèle de pointe le plus cher—GPT-4o, Claude 3.5 Sonnet, ou quel que soit le dernier cri cette semaine—pour chaque tâche.
Le hack : mettre en œuvre le routage des modèles.Évaluez l'adéquation et l'objectif d'une tâche. Si un employé résume un e-mail basique, dirigez cette requête vers un modèle plus ancien et moins cher. Réservez les jetons premium pour le codage complexe, le raisonnement stratégique approfondi ou le travail créatif à enjeux élevés. Adaptez la puissance aux besoins.
2. Exploitez les modèles locaux et open-source
Pour couper le cordon des factures massives d'IA dans le cloud, les entreprises demandent de plus en plus aux employés d'utiliser des modèles open-source qui fonctionnent localement sur les serveurs de l'entreprise ou directement sur les appareils des employés. Si vous contrôlez l'infrastructure, vous cessez de payer le péage des jetons aux laboratoires tiers. Le coût initial de mise en place est réel, mais les économies à long terme sont substantielles.
3. Surveillez le marché mondial
Les données montrent que les laboratoires d'IA chinois proposent actuellement des jetons à des prix nettement inférieurs à ceux de leurs homologues américains, grâce à une énergie moins chère et à des modèles très efficaces. Cet avantage de coût leur confère une énorme augmentation du volume de consommation de jetons. Gardez un œil sur les dynamiques de prix mondiales pendant que vous construisez votre pile technologique. Le jeton le moins cher n'est pas toujours le meilleur jeton, mais il est bon de savoir où le marché se dirige.
Accélérez la digitalité, de manière durable
À la fin de la journée, la véritabletransformation numérique ne consiste pas en une adoption aveugle. Il s'agit d'aligner des technologies de pointe avec une efficacité commerciale réelle.
Ne laissez pas la peur de manquer une opportunité vous pousser à donner à votre équipe un chèque en blanc pour la puissance de calcul. Définissez le ROI. Adaptez le modèle à la tâche. Maintenez une gouvernance stricte sur votre pile technologique.
La révolution de l'IA ne ralentit pas. Elle grandit simplement. Et grandir signifie apprendre à vivre avec un budget.
Restez en avance sur la courbe—et sous le budget.
— James
Originally published on MTS Blog & Research