Startup AI Tiongkok, MiniMax, telah merilis model bahasa besar (LLM) terbarunya, M2.7, menandai fase baru dalam pengembangan AI: perbaikan diri secara rekursif. Tidak seperti model tradisional yang mengandalkan penyesuaian manusia, M2.7 dirancang untuk mengoptimalkan proses penelitian dan pengembangannya secara mandiri. Langkah ini menandakan pergeseran ke arah sistem AI yang bukan hanya merupakan hasil rekayasa manusia namun juga arsitek aktif dari kemajuan mereka sendiri.
Lingkaran Evolusi Diri Dijelaskan
MiniMax telah mengintegrasikan M2.7 ke dalam rangkaian pembelajaran penguatannya, sehingga model tersebut dapat menangani 30–50% alur kerja pengembangannya sendiri. Hal ini mencakup proses debug otonom, analisis metrik, dan modifikasi kode melalui loop berulang. Model ini tidak hanya mengotomatiskan tugas-tugas sederhana; ia secara aktif meningkatkan kinerja pemrogramannya sendiri dengan menganalisis lintasan kegagalan dan merencanakan penyesuaian kode.
Menurut Kepala Teknik MiniMax Skyler Miao, model ini “sengaja dilatih agar lebih baik dalam merencanakan dan memperjelas persyaratan dengan pengguna”. Langkah berikutnya melibatkan simulator pengguna yang lebih kompleks untuk mendorong kemampuan ini lebih jauh lagi. Dalam kompetisi pembelajaran mesin, M2.7 telah mencapai perolehan medali sebesar 66,6%, menyamai Gemini 3.1 dari Google dan mendekati tolok ukur yang ditetapkan oleh Claude Opus 4.6 dari Anthropic.
Pergeseran Strategis: Dari Model Open Source ke Model Proprietary
Pergerakan MiniMax menuju model kepemilikan mengikuti tren di kalangan startup AI Tiongkok. Hampir sepanjang tahun lalu, perusahaan-perusahaan ini menjadi pemimpin di bidang AI sumber terbuka, menawarkan solusi yang hemat biaya dan dapat disesuaikan. Namun, seperti para pemimpin AS seperti OpenAI, Google, dan Anthropic, MiniMax kini fokus pada pengembangan dan peluncuran LLM eksklusif dan mutakhir.
Pergeseran ini terlihat jelas dalam rilis terbaru: GLM-5 Turbo dari z.ai dan rumor bahwa tim Qwen dari Alibaba juga sedang melakukan pengembangan eksklusif. Hal ini berarti akses yang lebih terbuka akan berkurang, namun potensi inovasi akan lebih cepat dan kontrol yang lebih besar terhadap kemampuan AI tingkat lanjut.
Peningkatan Performa: M2.7 vs. M2.5
M2.7 menunjukkan peningkatan yang signifikan dibandingkan pendahulunya, M2.5, khususnya dalam tugas teknik dunia nyata. Berikut rincian metrik utama:
- Rekayasa Perangkat Lunak: M2.7 memperoleh skor 56,22% pada benchmark SWE-Pro, setara dengan GPT-5.3-Codex.
- Produktivitas Kantor: Mencapai skor Elo 1495 pada GDPval-AA, mengungguli pesaing sumber terbuka.
- Pengurangan Halusinasi: Mengurangi tingkat halusinasi hingga 34%, lebih rendah dari Claude Sonnet 4.6 (46%) dan Gemini 3.1 Pro Preview (50%).
- Pemahaman Sistem: Mendapat skor 57,0% di Terminal Bench 2, yang menunjukkan pemahaman yang lebih mendalam tentang logika operasional.
Kecerdasan model secara keseluruhan telah meningkat sebesar 8 poin pada Indeks Kecerdasan Analisis Buatan hanya dalam satu bulan, menempatkannya di peringkat ke-8 secara global. Namun, kinerjanya lebih buruk daripada M2.5 pada tugas “pengkodean getaran” di BridgeBench, yang menunjukkan bahwa spesialisasi itu penting.
Penetapan Harga dan Integrasi
MiniMax M2.7 tersedia melalui MiniMax API dan platform Agen dengan harga bersaing: 0,30 dolar per 1 juta token masukan dan 1,20 dolar per 1 juta token keluaran. Hal ini menjadikannya salah satu model AI frontier paling terjangkau yang tersedia, lebih murah dibandingkan kebanyakan pesaing, termasuk Grok 4.1 Fast, Gemini 3 Flash, dan Claude Haiku 4.5.
Model ini terintegrasi secara mulus dengan alat pengembang utama seperti Claude Code, Cursor, dan Zed, serta Anthropic SDK. Hal ini memastikan kemudahan adopsi bagi pengembang menggunakan alur kerja yang ada.
Implikasi Strategis bagi Perusahaan
Rilis M2.7 menunjukkan bahwa AI agen kini siap produksi, mampu mengurangi waktu pemulihan secara signifikan untuk insiden produksi langsung (di bawah tiga menit). Hal ini memiliki implikasi besar bagi tim SRE dan DevOps.
Perusahaan harus memutuskan apakah mereka puas dengan AI sebagai asisten atau siap untuk mengintegrasikan tim otonom yang mampu melaksanakan proyek secara end-to-end. Efisiensi biaya M2.7 – kurang dari sepertiga biaya GLM-5 untuk kecerdasan setara – menjadikannya pilihan menarik bagi organisasi yang berfokus pada efisiensi dan alur kerja dokumen profesional.
Namun, model yang berasal dari Tiongkok dan kurangnya akses offline dapat menimbulkan tantangan bagi perusahaan-perusahaan AS dan Barat, terutama yang berada di industri yang diatur. Pada akhirnya, peralihan ke model self-evolving berarti bahwa ROI akan semakin bergantung pada keuntungan rekursif dari sistem itu sendiri. Organisasi yang mengadopsi model seperti itu dapat mempercepat siklus iterasinya dibandingkan dengan organisasi yang mengandalkan penyempurnaan statis yang hanya dilakukan oleh manusia.
