Dewan AI Multi-Model: Pengubah Permainan

Saya baru-baru ini membangun sistem yang memaksa beberapa model AI untuk berdebat satu sama lain sebelum menjawab pertanyaan. Butuh satu jam. Hal ini agak menakutkan. Dan itu mungkin hal terpenting yang saya bangun tahun ini.

Izinkan saya menjelaskan alasannya.

Perangkap Model Tunggal: Salah dengan Percaya Diri

Setiap konsultan AI dan arsitek sistem pernah melihat mimpi buruk ini. Itu dimainkan dengan cara yang sama setiap saat.

Model AI merekomendasikan arsitektur perangkat lunak tertentu. Klien membangunnya. Hal ini pada dasarnya memiliki kelemahan.Hasil: penulisan ulang $50.000.

Model AI mengatakan,"Ya, ekspresi reguler ini aman."Tim menyebarkannya ke produksi.Hasilnya: pelanggaran keamanan besar-besaran.

Model AI menyarankan pendekatan kepatuhan yang baru. Regulator mengaudit perusahaan tersebut.Hasilnya: denda $1 juta.

Model tunggal, betapapun canggihnya, memiliki titik buta yang melekat. Mereka tidak mengetahui apa yang tidak mereka ketahui. Yang lebih berbahaya lagi, tidak ada tim merah internal yang menantang hasil mereka.

Risiko terbesar dalam teknologi perusahaan saat ini bukanlah kesalahan AI. AI pasti akan salah jika tidak ada yang memeriksa pekerjaannya.

Solusinya: Musyawarah yang Bermusuhan

Daripada mengandalkan satu oracle yang maha tahu, saya membangun sebuah sistem yang menyatukan adewan direksi—sebuah dewan yang terdiri dari beberapa LLM berbeda yang dipaksa untuk memperdebatkan suatu masalah sebelum memberikan jawaban kepada pengguna.

Inilah yang tampak seperti musyawarah nyata di dalam sistem:

Putaran 1 (Proposal):Kimi K2.7 mengusulkan,"Gunakan Server-Sent Events untuk fitur ini. Lebih sederhana dan ringan."

Putaran 2 (Kritik):Claude Opus 4.8 berpendapat,"Anda melewatkan utang protokol ganda. Sebagian besar dasbor pasti memerlukan fitur dua arah. SSE akan menghambat kita."

Putaran 3 (Sanggahan):Kimi K2.7 menjawab,"Poin yang valid. Namun abstraksi transportasi memecahkan masalah ini—kita dapat mengimplementasikan SSE sekarang untuk kecepatan, dan kemudian beralih ke WebSocket dengan lancar tanpa perlu menulis ulang secara besar-besaran."

Hasilnya:Tidak ada model yang secara teknis menang. Sebaliknya, dewan menghasilkan opsi ketiga yang sangat berbeda, yang tidak ada model yang memulainya.

Ini bukan sistem pemungutan suara. Ini tidak mengambil rata-rata dari tiga keluaran. Itu benarperselisihan yang terstruktur dan saling bermusuhanyang memaksa kriteria keputusan nyata muncul ke permukaan.

Bagaimana Dewan Beroperasi

Sistem ini mengubah profil ekonomi dan keamanan unit penerapan AI. Inilah yang dicapai arsitektur:

Perutean Biaya Cerdas.Ini merutekan kueri sederhana dan berisiko rendah ke model termurah yang mampu. Bertanya"Bagaimana cuacanya?"berharga $0,0006. Tidak perlu membakar token premium untuk hal-hal sepele.

Eskalasi Cerdas.Hal ini secara otomatis meningkatkan keputusan yang rumit dan berisiko tinggi ke fase debat multi-model. Tinjauan arsitektur yang cermat mungkin memerlukan biaya $0,09. Itu adalah asuransi murah terhadap penulisan ulang $50.000.

Dekomposisi Tugas.Ini memecah tugas-tugas besar dan ambigu—misalnya"merancang platform fintech global"—menjadi lima hingga tujuh langkah khusus yang ditangani oleh persona agen tertentu. Tidak ada satu model pun yang tersedak dalam cakupannya.

Transparansi Radikal.Ini memunculkan perbedaan pendapat lengkap dengan skor keyakinan. Ia tidak pernah menyembunyikan perselisihan. Jika modelnya tidak setuju, Anda akan melihat dengan tepat di mana dan mengapa.

Jalur Audit yang Tidak Dapat Diubah.Hal ini menghasilkan sejarah yang lengkap dan dapat dilacak mengenai siapa yang mengatakan apa, dan mengapa suatu keputusan diambil. Ketika regulator bertanya, Anda memiliki transkripnya.

Penendangnya? Seluruh sistem ini berjalan pada sistem yang sudah adaPrimitif OpenClaw.Hal ini tidak memerlukan infrastruktur kepemilikan baru. Ini adalah konfigurasi murni dan rekayasa cepat tingkat lanjut.

Wawasan Nyata: Tata Kelola Atas Tenaga Kuda

Kesimpulan utama dari eksperimen ini bukanlah tentang pencapaianAI yang lebih baik.Ini tentangtata kelola AI.

Pikirkan tentang bagaimana masyarakat manusia menangani keputusan-keputusan berisiko tinggi:

Pengadilan memiliki penuntutan dan pembelaan.
Sains membutuhkan tinjauan sejawat yang ketat.
Bisnis dipandu oleh dewan direksi.
Kedokteran bergantung pada opini kedua.

Mengapa keputusan-keputusan yang dibantu oleh AI—keputusan-keputusan yang semakin mempengaruhi kehidupan manusia dan kelangsungan hidup perusahaan—tidak seketat keputusan-keputusan manusia?

Visi Pekerjaan Masa Depan

Visi saya untuk AI perusahaan sangat ketat:

Tidak ada satu pun AI yang boleh mengambil keputusan yang memengaruhi kehidupan manusia tanpa pertimbangan terstruktur.

Setiap keputusan otomatis harus menunjukkan alasannya, tingkat kepercayaannya, dan segala perbedaan pendapat.

Jejak audit tidak dapat dinegosiasikan.

Biaya komputasi merupakan kendala, bukan tujuan akhir.

Pola dewan ini bersifat portabel. Ini muncul sebagai standar baru. Dan yang paling penting, ini adalah sumber terbuka. Hal ini tidak menyelesaikan masalah halusinasi secara sempurna, namun memperbaikinya secara terukur, transparan, dan murah.

Jika Anda ingin membangun jembatan AI-ke-manusia yang benar-benar dapat dipercaya oleh perusahaan Anda, berhentilah menanyakan satu model saja sebagai jawabannya.Mulailah membangun dewan.

Sistem lengkapnya bersumber terbuka dan siap dipasang tanpa ketergantungan—hanya Python.

Lihat di GitHub:https://github.com/james-mtsoln/llm-council

Tetap terdepan.

— Yakobus

Saya Membangun Dewan AI Multi-Model dalam 1 Jam. Inilah Mengapa Ini Mengubah Segalanya.

Perangkap Model Tunggal: Salah dengan Percaya Diri

Solusinya: Musyawarah yang Bermusuhan

Bagaimana Dewan Beroperasi

Wawasan Nyata: Tata Kelola Atas Tenaga Kuda

Visi Pekerjaan Masa Depan