Čínsky AI startup MiniMax vydal model M2.7. Technická komunita si rýchlo všimla, že nejde iba o lepšiu verziu staršieho modelu. M2.7 prináša schopnosti, ktoré sú dôležité najmä pre vývoj, kancelársku produktivitu, agentné workflow a autonómny výskum.
Softvérové inžinierstvo na úrovni senior vývojára
Najsilnejšou oblasťou M2.7 je vývoj softvéru. Model neslúži iba na generovanie úryvkov kódu, ale zvláda širší vývojový cyklus:
- návrh systému od nuly,
- iterácie a rozširovanie funkcionality,
- code review a systémové testovanie,
- podporu pre web, Android, iOS aj Windows projekty.
| Benchmark | Čo meria | Výsledok M2.7 |
|---|
| SWE-Pro | Reálne softvérové inžinierstvo | 56,22 % |
| VIBE-Pro | Dodanie projektu end-to-end | 55,6 % |
| Terminal Bench 2 | Komplexné inžinierske systémy | 57,0 % |
| SWE Multilingual | Viacjazyčné programovanie | 76,5 |
| PinchBench | Agentic AI coding | 86,2 % |
M2.7 pred písaním kódu číta širší kontext, sťahuje okolité súbory, analyzuje závislosti a mapuje call chains. V produkcii to znamená lepšie hľadanie chýb, rýchlejšie hypotézy a schopnosť pripraviť dočasnú opravu, kým vzniká finálny merge request.
Kancelárska produktivita
Druhá silná oblasť je práca s dokumentmi. M2.7 dokáže analyzovať tabuľky, vytvárať finančné modely, pracovať s prezentáciami a robiť viacstupňové revízie dokumentov. Pre finančné, analytické a manažérske tímy to znamená rýchlejšiu prípravu reportov a prezentácií.
Multi-agentné tímy
MiniMax M2.7 podporuje koordinovanú spoluprácu viacerých AI agentov. Jeden agent môže analyzovať požiadavku, druhý písať kód, tretí testovať a štvrtý pripravovať dokumentáciu. Tento prístup je dôležitý najmä pri väčších projektoch, kde jedna AI rola nestačí.
Rekurzívne zlepšovanie a výskum
Model bol nasadený do autonómnej iteračnej slučky: analyzuj zlyhanie, naplánuj zmeny, uprav scaffold kód, spusti evaluáciu, porovnaj výsledky a rozhodni, či zmeny zachovať. Pri viac než 100 kolách dosiahol 30 % zlepšenie výkonu na interných evaluačných sadách.
Súťaže v strojovom učení
MiniMax testoval M2.7 v reálnych súťažiach strojového učenia s obmedzenými zdrojmi. Model sa zúčastnil 22 súťaží a s využitím krátkodobej pamäte, self-feedbacku a self-optimalizácie dosiahol 66,6 % mieru medailí.
FAQ
Čo M2.7 dokáže najlepšie? Softvérové inžinierstvo end-to-end, kancelársku produktivitu, finančnú analýzu, multi-agentnú spoluprácu a čiastočne autonómny výskum.
Je lepší než ChatGPT na kódovanie? V niektorých benchmarkoch je porovnateľný s frontier coding modelmi, najmä pri pomere výkon/cena.
Čo je Agent Teams? Funkcia na koordinovanú spoluprácu viacerých AI agentov na jednom projekte.
Koľko stojí? Uvádza sa 0,30 USD za milión vstupných tokenov a 1,20 USD za milión výstupných tokenov.
Čo to znamená pre firmy
Pre IT môže M2.7 znamenať agenta na debugging, code review a feature delivery. Pre financie prípravu reportov a modelov. Pre operations paralelné spracovanie objednávok, faktúr a dokumentov. Pre management rýchlejšie riešenie incidentov a lepší monitoring.