"เราสร้างสัตว์ประหลาด": เหตุใดเทคโนโลยีขนาดใหญ่จึงเบรกการใช้จ่ายของ AI

ในปีที่ผ่านมา การเล่าเรื่องทางธุรกิจนั้นเรียบง่าย: ให้ AI อยู่ในมือของพนักงานของคุณอย่างรวดเร็วที่สุดเท่าที่จะเป็นไปได้ การแข่งขันดำเนินต่อไป เครื่องมือมีมนต์ขลัง อนาคตคือตอนนี้
แต่เมื่อไม่นานมานี้ มีการเปลี่ยนแปลงครั้งใหญ่ในห้องประชุม ฮันนีมูนจบลงอย่างเป็นทางการแล้ว และบิลก็มาถึงแล้ว
ตามรายงานล่าสุด ผู้ใช้กลุ่มแรกๆ เช่น Amazon, Walmart, Cisco, Uber และ Meta กำลังจำกัดการใช้งาน AI ภายในอย่างแข็งขัน ไม่ใช่เพราะเทคโนโลยีล้มเหลว เพราะพวกเขาดูบิลเซิร์ฟเวอร์แล้วพบว่าพวกเขาสร้างสัตว์ประหลาดทางการเงินขึ้นมาโดยไม่ได้ตั้งใจ
ในขณะที่เราช่วยธุรกิจนำทางการเปลี่ยนแปลงทางดิจิทัลสิ่งสำคัญคือต้องเข้าใจว่าเหตุใดจึงเกิดเหตุการณ์เช่นนี้และจะหลีกเลี่ยงได้อย่างไรกับดักโทเค็น
การเพิ่มขึ้นของตัวแทน (และการตายของการเรียกเก็บเงินแบบอัตราคงที่)
เราทุกคนถูกฝึกมาระยะหนึ่งแล้วให้คิดว่า AI มีราคาถูก หรือแม้กระทั่งฟรี แต่การคำนวณไม่เคยฟรี
ต้นทุนเริ่มแรกได้รับการสนับสนุนจากรูปแบบการสมัครสมาชิกแบบเหมาจ่าย คุณจ่ายเงิน 20 ดอลลาร์ต่อเดือนและเข้าถึงโมเดล Frontier ได้ไม่จำกัด มันรู้สึกเหมือนเป็นการต่อรองราคา แต่เนื่องจากห้องแล็บ AI เช่น OpenAI และ Anthropic เปลี่ยนไปใช้ตามการใช้งานการเรียกเก็บเงินต่อโทเค็นต้นทุนที่แท้จริงของปัญญาประดิษฐ์กำลังถูกเปิดเผย
โทเค็นสำหรับผู้ที่ไม่ได้ฝึกหัดคือหน่วยพื้นฐานของข้อมูลที่ประมวลผลโดยโมเดล AI ทุกคำที่คุณส่ง ทุกคำที่คุณได้รับ ทุกขั้นตอนการให้เหตุผลระหว่างนั้น—โทเค็น และพวกมันก็เพิ่มขึ้นอย่างรวดเร็ว
การเปลี่ยนแปลงการเรียกเก็บเงินนี้เกิดขึ้นพร้อมกับวิวัฒนาการทางเทคโนโลยี: การก้าวกระโดดจากแชทบอทมาเป็นตัวแทนเอไอ
แชทบอทรอการแจ้ง คำตอบ และเข้าสู่โหมดสลีป AI Agent เป็นอิสระ มันวนซ้ำ มันเป็นเหตุผล. มันดำเนินการเวิร์กโฟลว์ที่ซับซ้อนและทริกเกอร์ตัวแทนอื่นๆ ดังที่ Jeetu Patel ประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ของ Cisco กล่าวไว้ การปรับใช้ตัวแทนจำเป็นต้องมีโครงสร้างพื้นฐานที่เพิ่มมากขึ้นแบบทวีคูณ พนักงานที่เป็นมนุษย์ทุกคนอาจมีเจ้าหน้าที่ AI นับสิบ ร้อย หรือแม้แต่พันคนที่ทำงานเบื้องหลังอย่างไม่เหน็ดเหนื่อย
การประมวลผลกำลังส่าย
การตรวจสอบความเป็นจริงขององค์กร: เผาผลาญงบประมาณปี 2026 ภายในเดือนเมษายน
เมื่อเทคโนโลยีกลายเป็นของเล่นแทนที่จะเป็นเครื่องมือ งบประมาณก็หมดไป
เอาเวิร์คาโตบริษัทซอฟต์แวร์ที่เห็นการใช้งาน AI แพร่กระจาย"เหมือนไฟป่า"ท่ามกลางพนักงาน 1,300 คน เมื่อ Anthropic เปลี่ยนมาใช้การเรียกเก็บเงินต่อโทเค็นในเดือนพฤษภาคม ต้นทุนของ Workato ก็พุ่งสูงขึ้น7 เท่าในวันแรกปฏิกิริยาของ CIO ของพวกเขา?“ให้ตายเถอะ เราสร้างสัตว์ประหลาดขึ้นมา”
อูเบอร์ต้องเผชิญกับวิกฤติเช่นเดียวกัน COO ของพวกเขายอมรับว่ามันเป็นไปไม่ได้ที่จะพิสูจน์การใช้จ่ายโทเค็นจำนวนมหาศาลเทียบกับผลลัพธ์ของฟีเจอร์ผู้บริโภคจริง สถานการณ์ไม่สะดวกจนทำให้ Uber หมดงบประมาณ AI ปี 2026 ที่จัดสรรไว้ทั้งหมดภายในเดือนเมษายนของปีนี้ ขณะนี้พวกเขาได้จำกัดการใช้จ่ายโทเค็นของพนักงานแต่ละคนไว้ที่ 1,500 ดอลลาร์ต่อเดือน
ณอเมซอนวิศวกรกำลังสร้างตัวแทนเพียงเพื่อไต่อันดับกระดานผู้นำด้านประสิทธิภาพการทำงานภายใน ฝ่ายบริหารต้องก้าวเข้ามาและเตือนทีมอย่างชัดเจนให้หยุดใช้“เอไอเพื่อเอไอ”
มีลวดลายชัดเจน การนำ AI มาใช้อย่างไม่มีการตรวจสอบ รวมกับการเรียกเก็บเงินต่อโทเค็นและตัวแทนอัตโนมัติ ทำให้เกิดการระเบิดของต้นทุนที่แซงหน้าผลตอบแทนที่วัดได้
แฮ็คชีวิต:ความรับผิดชอบทางการเงินของ AIและการกำหนดเส้นทางแบบจำลอง
นี่หมายความว่าการปฏิวัติ AI กำลังหยุดชะงักใช่ไหม ไม่อย่างแน่นอน หมายความว่าอุตสาหกรรมกำลังเติบโตเต็มที่ เรากำลังเข้าสู่ยุคของความรับผิดชอบทางการเงินของ AI.
หากคุณเป็นผู้นำธุรกิจที่บูรณาการ AI นี่คือ Playbook ของคุณเพื่อหลีกเลี่ยงไม่ให้แผนกไอทีของคุณล้มละลาย
1. หยุดใช้เฟอร์รารีเพื่อไปร้านขายของชำ
คุณไม่จำเป็นต้องมีรุ่นชายแดนที่แพงที่สุดอย่าง GPT-4o, Claude 3.5 Sonnet หรืออะไรก็ตามที่น่าสนใจในสัปดาห์นี้ สำหรับงานทุกๆ งาน
แฮ็ค: ใช้ Model Routingประเมินความเหมาะสมและวัตถุประสงค์ของงาน หากพนักงานกำลังสรุปอีเมลพื้นฐาน ให้กำหนดเส้นทางการสืบค้นนั้นไปยังรุ่นที่เก่ากว่าและราคาถูกกว่า บันทึกโทเค็นระดับพรีเมียมสำหรับการเขียนโค้ดที่ซับซ้อน การใช้เหตุผลเชิงกลยุทธ์เชิงลึก หรืองานสร้างสรรค์ที่มีเดิมพันสูง จับคู่แรงม้ากับทางหลวง
2. ใช้ประโยชน์จากโมเดลท้องถิ่นและโอเพ่นซอร์ส
เพื่อลดค่าใช้จ่ายด้าน AI บนคลาวด์ขนาดใหญ่ บริษัทต่างๆ จึงขอให้พนักงานใช้โมเดลโอเพ่นซอร์สที่ทำงานภายในเครื่องบนเซิร์ฟเวอร์ของบริษัทหรือบนอุปกรณ์ของพนักงานโดยตรงมากขึ้นเรื่อยๆ หากคุณควบคุมโครงสร้างพื้นฐาน คุณจะหยุดจ่ายค่าผ่านทางโทเค็นให้กับห้องปฏิบัติการของบุคคลที่สาม ค่าใช้จ่ายในการติดตั้งล่วงหน้านั้นเป็นเรื่องจริง แต่การประหยัดในระยะยาวนั้นมีมาก
3. จับตาดูตลาดโลก
ข้อมูลแสดงให้เห็นว่าห้องปฏิบัติการ AI ของจีนกำลังเสนอโทเค็นในราคาที่ต่ำกว่าห้องปฏิบัติการในสหรัฐฯ อย่างมาก โดยได้แรงหนุนจากพลังงานที่ถูกกว่าและแบบจำลองที่มีประสิทธิภาพสูง ความได้เปรียบด้านต้นทุนนี้ทำให้ปริมาณการใช้โทเค็นเพิ่มขึ้นอย่างมาก จับตาดูการเปลี่ยนแปลงของราคาทั่วโลกในขณะที่คุณสร้างกลุ่มเทคโนโลยีของคุณ โทเค็นที่ถูกที่สุดไม่ใช่โทเค็นที่ดีที่สุดเสมอไป แต่ก็คุ้มค่าที่จะรู้ว่าตลาดกำลังมุ่งหน้าไปทางใด
เร่งความเป็นดิจิทัลอย่างยั่งยืน
ในตอนท้ายของวันจริงการเปลี่ยนแปลงทางดิจิทัลไม่เกี่ยวกับการรับเลี้ยงบุตรบุญธรรมแบบตาบอด เป็นเรื่องเกี่ยวกับการปรับเทคโนโลยีที่ทันสมัยให้สอดคล้องกับประสิทธิภาพทางธุรกิจที่แท้จริง
อย่าปล่อยให้ความกลัวที่จะพลาดผลักดันให้คุณมอบเช็คเปล่าสำหรับพลังการประมวลผลให้กับทีมของคุณ กำหนด ROI จับคู่โมเดลกับงาน รักษาการกำกับดูแลกลุ่มเทคโนโลยีของคุณอย่างเข้มงวด
การปฏิวัติ AI ไม่ได้ชะลอตัวลง มันเพิ่งจะโตขึ้น และการเติบโตหมายถึงการเรียนรู้ที่จะใช้ชีวิตภายในงบประมาณที่กำหนด
ก้าวนำหน้าคู่แข่ง—และอยู่ภายใต้งบประมาณ
— เจมส์
Originally published on MTS Blog & Research