"우리는 괴물을 만들었다": 왜 대형 기술 기업들이 AI 지출을 급격히 줄이고 있는가

지난 1년 동안 비즈니스 내러티브는 간단했습니다: 가능한 한 빨리 AI를 직원들에게 제공하라. 경쟁이 시작되었습니다. 도구들은 마법 같았습니다. 미래는 지금이었습니다.
그러나 최근, 이사회에서 거대한 변화가 일어났습니다. 허니문은 공식적으로 끝났습니다. 그리고 청구서가 도착했습니다.
최근 보고서에 따르면, 아마존, 월마트, 시스코, 우버, 메타와 같은 초기 채택자들은 내부 AI 사용을 적극적으로 제한하고 있습니다. 기술이 실패했기 때문이 아니라, 그들이 서버 청구서를 살펴보고 우연히 재정적 괴물을 만들어버렸다는 것을 깨달았기 때문입니다.
우리가 기업들이 디지털 전환을 탐색하도록 도와줄 때, 디지털 전환이 왜 일어나고 있는지 이해하고, 토큰 함정을 피하는 것이 중요합니다.
에이전트의 부상(그리고 정액 요금 청구의 종말)
한동안 우리는 모두 AI를 저렴하거나 심지어 무료로 생각하도록 훈련받았습니다. 하지만 컴퓨팅은 결코 무료가 아닙니다.
초기 비용은 정액 구독 모델로 보조되었습니다. 매달 이십 달러를 지불하면 최전선 모델에 무제한으로 접근할 수 있었습니다. 그것은 매우 저렴하게 느껴졌습니다. 그러나 OpenAI와 Anthropic과 같은 AI 연구소가 사용 기반 토큰당 청구로 전환함에 따라인공지능의 진정한 비용이 드러나고 있습니다.
토큰은 초보자를 위해 설명하자면, AI 모델이 처리하는 기본 데이터 단위입니다. 당신이 보내는 모든 단어, 당신이 받는 모든 단어, 그 사이의 모든 추론 단계—모두 토큰입니다. 그리고 이들은 빠르게 쌓입니다.
이러한 청구 방식의 변화는 기술 진화와 동시에 일어났습니다: 챗봇에서 AI 에이전트로의 도약입니다.
챗봇은 당신의 프롬프트를 기다리고, 응답하며, 잠에 듭니다. AI 에이전트는 자율적입니다. 그것은 반복하고, 추론하며, 복잡한 작업 흐름을 실행하고 다른 에이전트를 트리거합니다. 시스코의 최고 제품 책임자 지투 파텔이 언급했듯이, 에이전트를 배포하려면 기하급수적으로 더 많은 인프라가 필요합니다. 모든 인간 직원이 갑자기 열 개, 백 개, 또는 심지어 천 개의 AI 에이전트가 배경에서 끊임없이 작업하는 상황이 될 수 있습니다.
컴퓨팅 소모는 엄청납니다.
기업 현실 점검: 2026년 예산을 4월까지 소진하기
기술이 도구가 아닌 장난감이 될 때, 예산은 사라집니다.
가져가다 워카토 , 인공지능 사용이 "불처럼" 1,300명의 직원들 사이에서 퍼지는 것을 목격한 소프트웨어 회사입니다. 앤트로픽이 5월에 토큰당 과금으로 전환했을 때, 워카토의 비용이 첫날에 7배 급증했습니다. 그들의 CIO의 반응은? "세상에, 우리는 괴물을 만들었군요."
우버 는 유사한 위기에 직면했습니다. 그들의 COO는 실제 소비자 기능 출력에 대한 대규모 토큰 지출을 정당화하는 것이 불가능해지고 있다고 인정했습니다. 상황이 너무 심각해져서 우버는 올해 4월까지 2026년 AI 예산을 모두 소진했습니다. 이제 그들은 개별 직원의 토큰 지출을 월 1,500달러로 제한했습니다.
아마존 에서 엔지니어들은 내부 생산성 리더보드를 오르기 위해 에이전트를 구축하고 있었습니다. 경영진은 팀들에게 "AI를 위한 AI" 사용을 중단하라고 명확하게 경고해야 했습니다. "AI를 위한 AI."
패턴은 명확합니다. 통제되지 않은 AI 채택, 토큰당 청구 및 자율 에이전트의 결합은 측정 가능한 수익을 초과하는 비용 폭발을 초래합니다.
인생 해킹:AI 재무 책임 및 모델 라우팅
그렇다면 AI 혁명이 정체되고 있다는 뜻인가요? 절대 그렇지 않습니다. 이는 산업이 성숙해가고 있다는 의미입니다. 우리는 AI 재무 책임 의 시대에 접어들고 있습니다.
AI를 통합하는 비즈니스 리더라면, IT 부서를 파산시키지 않기 위한 플레이북이 여기 있습니다.
1. 장보기 위해 페라리를 타지 마세요
모든 작업에 대해 가장 비싼 최첨단 모델—GPT-4o, Claude 3.5 Sonnet 또는 이번 주의 최신 기술—이 필요하지 않습니다.
해킹: 모델 라우팅 구현하기.작업의 적합성과 목적을 평가하세요. 직원이 기본 이메일을 요약하고 있다면, 그 쿼리를 오래된 저렴한 모델로 라우팅하세요. 복잡한 코딩, 깊이 있는 전략적 사고, 또는 고위험 창의적 작업을 위해 프리미엄 토큰을 절약하세요. 힘을 도로에 맞추세요.
2. 로컬 및 오픈 소스 모델 활용하기
대규모 클라우드 AI 비용을 줄이기 위해, 기업들은 직원들에게 회사 서버나 직원 장치에서 직접 실행되는 오픈 소스 모델을 사용하도록 점점 더 요구하고 있습니다. 인프라를 제어하면 제3자 연구소에 토큰 요금을 지불하는 것을 중단할 수 있습니다. 초기 설치 비용은 실제로 발생하지만, 장기적인 절감 효과는 상당합니다.
3. 글로벌 시장 주시하기
데이터에 따르면, 중국 AI 연구소는 현재 미국의 동종 연구소보다 훨씬 낮은 가격으로 토큰을 제공하고 있으며, 이는 저렴한 에너지와 매우 효율적인 모델 덕분입니다. 이 비용 우위는 그들에게 토큰 소비량의 대폭 증가를 가져오고 있습니다. 기술 스택을 구축할 때 글로벌 가격 동향을 주의 깊게 살펴보세요. 가장 저렴한 토큰이 항상 최고의 토큰은 아니지만, 시장이 어디로 향하고 있는지 아는 것은 가치가 있습니다.
디지털화 가속화, 지속 가능하게
결국, 진정한디지털 전환 은 맹목적인 채택에 관한 것이 아닙니다. 최첨단 기술을 실제 비즈니스 효율성과 일치시키는 것입니다.
놓치는 것에 대한 두려움이 팀에게 컴퓨팅 파워에 대한 백지 수표를 주도록 밀어붙이지 않도록 하세요. ROI를 정의하세요. 모델을 작업에 맞추세요. 기술 스택에 대한 엄격한 거버넌스를 유지하세요.
AI 혁명은 속도가 느려지지 않고 있습니다. 단지 성장하고 있을 뿐입니다. 그리고 성장한다는 것은 예산 내에서 생활하는 것을 배우는 것을 의미합니다.
곡선을 앞서 나가세요—그리고 예산 내에서 유지하세요.
— 제임스
Originally published on MTS Blog & Research