Berita dan Artikel Terbaru

MiniMax M2.7: Bangkitnya AI yang Berkembang Sendiri

19.03.2026

Startup AI Tiongkok, MiniMax, telah merilis model bahasa besar (LLM) terbarunya, M2.7, menandai fase baru dalam pengembangan AI: perbaikan diri secara rekursif. Tidak seperti model tradisional yang mengandalkan penyesuaian manusia, M2.7 dirancang untuk mengoptimalkan proses penelitian dan pengembangannya secara mandiri. Langkah ini menandakan pergeseran ke arah sistem AI yang bukan hanya merupakan hasil rekayasa manusia namun juga arsitek aktif dari kemajuan mereka sendiri.

Lingkaran Evolusi Diri Dijelaskan

MiniMax telah mengintegrasikan M2.7 ke dalam rangkaian pembelajaran penguatannya, sehingga model tersebut dapat menangani 30–50% alur kerja pengembangannya sendiri. Hal ini mencakup proses debug otonom, analisis metrik, dan modifikasi kode melalui loop berulang. Model ini tidak hanya mengotomatiskan tugas-tugas sederhana; ia secara aktif meningkatkan kinerja pemrogramannya sendiri dengan menganalisis lintasan kegagalan dan merencanakan penyesuaian kode.

Menurut Kepala Teknik MiniMax Skyler Miao, model ini “sengaja dilatih agar lebih baik dalam merencanakan dan memperjelas persyaratan dengan pengguna”. Langkah berikutnya melibatkan simulator pengguna yang lebih kompleks untuk mendorong kemampuan ini lebih jauh lagi. Dalam kompetisi pembelajaran mesin, M2.7 telah mencapai perolehan medali sebesar 66,6%, menyamai Gemini 3.1 dari Google dan mendekati tolok ukur yang ditetapkan oleh Claude Opus 4.6 dari Anthropic.

Pergeseran Strategis: Dari Model Open Source ke Model Proprietary

Pergerakan MiniMax menuju model kepemilikan mengikuti tren di kalangan startup AI Tiongkok. Hampir sepanjang tahun lalu, perusahaan-perusahaan ini menjadi pemimpin di bidang AI sumber terbuka, menawarkan solusi yang hemat biaya dan dapat disesuaikan. Namun, seperti para pemimpin AS seperti OpenAI, Google, dan Anthropic, MiniMax kini fokus pada pengembangan dan peluncuran LLM eksklusif dan mutakhir.

Pergeseran ini terlihat jelas dalam rilis terbaru: GLM-5 Turbo dari z.ai dan rumor bahwa tim Qwen dari Alibaba juga sedang melakukan pengembangan eksklusif. Hal ini berarti akses yang lebih terbuka akan berkurang, namun potensi inovasi akan lebih cepat dan kontrol yang lebih besar terhadap kemampuan AI tingkat lanjut.

Peningkatan Performa: M2.7 vs. M2.5

M2.7 menunjukkan peningkatan yang signifikan dibandingkan pendahulunya, M2.5, khususnya dalam tugas teknik dunia nyata. Berikut rincian metrik utama:

Rekayasa Perangkat Lunak: M2.7 memperoleh skor 56,22% pada benchmark SWE-Pro, setara dengan GPT-5.3-Codex.
Produktivitas Kantor: Mencapai skor Elo 1495 pada GDPval-AA, mengungguli pesaing sumber terbuka.
Pengurangan Halusinasi: Mengurangi tingkat halusinasi hingga 34%, lebih rendah dari Claude Sonnet 4.6 (46%) dan Gemini 3.1 Pro Preview (50%).
Pemahaman Sistem: Mendapat skor 57,0% di Terminal Bench 2, yang menunjukkan pemahaman yang lebih mendalam tentang logika operasional.

Kecerdasan model secara keseluruhan telah meningkat sebesar 8 poin pada Indeks Kecerdasan Analisis Buatan hanya dalam satu bulan, menempatkannya di peringkat ke-8 secara global. Namun, kinerjanya lebih buruk daripada M2.5 pada tugas “pengkodean getaran” di BridgeBench, yang menunjukkan bahwa spesialisasi itu penting.

Penetapan Harga dan Integrasi

MiniMax M2.7 tersedia melalui MiniMax API dan platform Agen dengan harga bersaing: 0,30 dolar per 1 juta token masukan dan 1,20 dolar per 1 juta token keluaran. Hal ini menjadikannya salah satu model AI frontier paling terjangkau yang tersedia, lebih murah dibandingkan kebanyakan pesaing, termasuk Grok 4.1 Fast, Gemini 3 Flash, dan Claude Haiku 4.5.

Model ini terintegrasi secara mulus dengan alat pengembang utama seperti Claude Code, Cursor, dan Zed, serta Anthropic SDK. Hal ini memastikan kemudahan adopsi bagi pengembang menggunakan alur kerja yang ada.

Implikasi Strategis bagi Perusahaan

Rilis M2.7 menunjukkan bahwa AI agen kini siap produksi, mampu mengurangi waktu pemulihan secara signifikan untuk insiden produksi langsung (di bawah tiga menit). Hal ini memiliki implikasi besar bagi tim SRE dan DevOps.

Perusahaan harus memutuskan apakah mereka puas dengan AI sebagai asisten atau siap untuk mengintegrasikan tim otonom yang mampu melaksanakan proyek secara end-to-end. Efisiensi biaya M2.7 – kurang dari sepertiga biaya GLM-5 untuk kecerdasan setara – menjadikannya pilihan menarik bagi organisasi yang berfokus pada efisiensi dan alur kerja dokumen profesional.

Namun, model yang berasal dari Tiongkok dan kurangnya akses offline dapat menimbulkan tantangan bagi perusahaan-perusahaan AS dan Barat, terutama yang berada di industri yang diatur. Pada akhirnya, peralihan ke model self-evolving berarti bahwa ROI akan semakin bergantung pada keuntungan rekursif dari sistem itu sendiri. Organisasi yang mengadopsi model seperti itu dapat mempercepat siklus iterasinya dibandingkan dengan organisasi yang mengandalkan penyempurnaan statis yang hanya dilakukan oleh manusia.

MiniMax M2.7: Bangkitnya AI yang Berkembang Sendiri

Lingkaran Evolusi Diri Dijelaskan

Pergeseran Strategis: Dari Model Open Source ke Model Proprietary

Peningkatan Performa: M2.7 vs. M2.5

Penetapan Harga dan Integrasi

Implikasi Strategis bagi Perusahaan

Популярні

Koneksi NYT: Edisi Olahraga – Solusi untuk 29 September 2023

Penawaran Headphone Black Friday Terbaik 2025: AirPods, Bose, Sony dengan Harga...

Ketahanan Telepon Rumah yang Tak Terduga pada tahun 2026

Огляд Elo vagabond: мобільний контролер, який кращий, ніж хребет

Сьогоднішні поради, відповіді та довідка NYT Wordle за 14 липня #1486

Mahkamah Agung Bisa Memangkas Harga dan Menaikkan Upah – Tapi Trump...

NYT Connections #859: Petunjuk dan Solusi untuk 17 Oktober

Сьогоднішні відповіді на міні-кросворди NYT за 5 червня

Сьогоднішні поради щодо NYT Conneptions, відповіді на 9 серпня № 790

ВИБІР РЕДАКТОРА

Jutaan iPhone Terkena Spyware “Darksword” Baru

Obral Musim Semi Besar Amazon: Penawaran Awal Di Bawah $25

Gamma Meluncurkan Alat Gambar AI untuk Menyaingi Canva dan Adobe

ПОПУЛЯРНІ ПОВІДОМЛЕННЯ

H&M Berinvestasi pada Startup yang Mengubah CO₂ menjadi Bahan Pakaian

Can Virtual Reality Cultivate Empathy in an Age of Division?

Meta Meluncurkan Umpan Video Buatan AI, “Vibes,” di Eropa

ПОПУЛЯРНА КАТЕГОРІЯ