Čínský AI startup MiniMax vydal model M2.7. Technická komunita po celém světě si okamžitě všimla jednoho: tohle není jen "lepší verze předchozího modelu." M2.7 má schopnosti, které dosud žádný veřejně dostupný model nepředvedl — a výsledky na světových benchmarcích to potvrzují.
Tady je přesný přehled toho, co M2.7 umí nejlépe — s čísly ze zahraničních zdrojů.
Softwarové inženýrství na úrovni senior vývojáře
Toto je pravděpodobně nejsilnější oblast M2.7 a důvod, proč o něm vývojáři mluví jako o průlomu.
Model neslouží jen ke generování kódu. Podle oficiální dokumentace MiniMax a nezávislých testů platformy Kilo.ai zvládá M2.7 celý vývojový životní cyklus:
- návrh systému od nuly (0 → 1)
- iterace a rozšiřování funkcionality (1 → 10 → 90)
- code review a systémové testování (90 → 100)
- plná podpora pro Web, Android, iOS a Windows projekty
Co říkají čísla
| Benchmark |
Co měří |
Výsledek M2.7 |
| SWE-Pro |
Reálné softwarové inženýrství |
56,22 % (srovnatelné s GPT-5.3-Codex) |
| VIBE-Pro |
Dodání celého projektu end-to-end |
55,6 % (srovnatelné s Claude Opus 4.6) |
| Terminal Bench 2 |
Porozumění komplexním inženýrským systémům |
57,0 % |
| SWE Multilingual |
Vícejazyčné programování |
76,5 |
| PinchBench (Kilo.ai) |
Agentic AI coding |
86,2 % (jen 1,2 % za Claude Opus 4.6) |
Kilo.ai, která M2.7 testovala nezávisle, to popsala takto: M2.7 před psaním kódu čte obšírně kontext — stahuje okolní soubory, analyzuje závislosti, mapuje celé call chains. Díky tomu nachází chyby, které jiné modely přehlédnou.
A co je klíčové pro produkční prostředí: když v živém systému nastanou výpadky, M2.7 dokáže korelovat monitorovací metriky s deployment timeline, analyzovat trace sampling, navrhnout přesnou hypotézu, připojit se k databázi a ověřit příčinu. Přitom ihned nasadí dočasnou opravu, zatímco připravuje merge request. Výsledkem je zkrácení doby obnovy produkčního systému na méně než tři minuty.
Kancelářská produktivita: Excel, Word, PowerPoint na expert úrovni
Druhá oblast, kde M2.7 dominuje, je komplexní práce s kancelářskými dokumenty. Ne jednoduché úpravy — mluvíme o vícenásobných revizích, finančních modelech a analytických výstupech.
Na GDPval-AA benchmarku dosahuje M2.7 Elo skóre 1 495 — nejvyšší mezi open-source přístupnými modely, hned za Claude Opus 4.6, Sonnet 4.6 a GPT-5.4.
Co konkrétně zvládne
Excel: Finanční modelování na úrovni průmyslových expertů. Neuronad.com to popisuje konkrétně: zadáte cíl jako „analyzuj TSMC" — a M2.7 autonomně přečte výroční zprávy, earnings cally, zkříží je s externím výzkumem, sestaví vlastní model příjmů a vygeneruje výsledný report i prezentaci. Celé to opraví samo, pokud na chybu upozorníte.
Word a PowerPoint: Vícekolové revize s vysokou věrností. Model si pamatuje kontext mezi úpravami a neztrácí konzistenci při opakovaných změnách.
Instrukce: M2.7 udržuje 97% míru dodržování instrukcí při práci s více než 40 komplexními dovednostmi, každá přes 2 000 tokenů. To znamená: dáte mu složitý, vícevrstvý úkol — a on ho dokončí přesně tak, jak jste chtěli, bez zkratek.
Multi-agentní spolupráce — AI týmy, které pracují autonomně
Toto je novinka, která nemá v dosavadních modelech srovnání.
M2.7 přináší nativní Agent Teams — schopnost nasadit koordinované týmy AI agentů, kde každý agent plní specifickou roli. Nemluvíme o jednom chatbotu, který přepíná kontexty. Mluvíme o distribuovaném systému, kde agenti spolupracují jako skutečný tým.
Praktický příklad z MiniMax výzkumného týmu: agent začne diskusí o experimentální myšlence, pomůže s literárním přehledem, sleduje specifikaci experimentu, zpracovává data a spouští experimenty. Během experimentů autonomně monitoruje průběh, spouští log analysis, debugging, analýzu metrik, opravy kódu a smoke testy — identifikuje a konfiguruje jemné, ale klíčové změny, které by dříve vyžadovaly spolupráci více lidských výzkumníků z různých týmů.
Pro firmu to znamená
- Agent pro příjem a zpracování objednávek
- Agent pro analýzu dokumentů a faktur
- Agent pro monitoring systémů a incidenty
- Agent pro reporting a prezentace pro management
Všichni pracují současně, koordinovaně, bez přestávek.
Finanční analýza jako junior analytik
Toto je use case, který zaujal globální finanční komunitu.
V oblasti financí M2.7 funguje jako junior analytik — autonomně čte výroční zprávy, sestavuje modely příjmů a generuje analytické reporty.
Konkrétní workflow podle Neuronad.com:
- Zadáte ticker nebo název firmy
- M2.7 autonomně stáhne a přečte výroční zprávy a earnings cally
- Zkříží je s externími zdroji a výzkumem
- Sestaví vlastní revenue forecast model v Excelu
- Vygeneruje polished prezentaci v PowerPointu
- Opraví chyby na základě vašeho feedbacku
Bez jediné instrukce navíc. End-to-end.
Sebezdokonalování — schopnost, která nemá precedent
Tohle je vlastnost, která M2.7 odlišuje od úplně všeho, co bylo vydáno před ním.
MiniMax použil M2.7 k tomu, aby model sám budoval, monitoroval a optimalizoval vlastní reinforcement learning harnesses. Tím se přesunul k rekurzivnímu sebezdokonalování — budoucnosti, kde modely jsou stejně tak architekty vlastního pokroku jako produktem lidského výzkumu.
Jak to vypadalo v praxi
M2.7 byl nasazen do autonomní iterační smyčky: analyzuj selhání → naplánuj změny → uprav scaffold kód → spusť evaluace → porovnej výsledky → rozhodni, zda změny zachovat nebo vrátit. Tuto smyčku opakoval přes 100 kol.
Výsledek: 30% zlepšení výkonu na interních evaluačních sadách. A model přitom zvládl 30–50 % celého výzkumného workflow zcela autonomně.
Soutěže ve strojovém učení — 66,6% míra medailí
Tohle číslo zastavilo pozornost celé AI komunity.
MiniMax testoval M2.7 v reálných soutěžích strojového učení. Podmínky: omezené zdroje, jeden GPU A30, 24 hodin na úkol.
M2.7 se zúčastnil 22 soutěží strojového učení. S využitím krátkodobé paměti, self-feedbacku a self-optimalizace dosáhl míry medailí 66,6 % — což ho řadí mezi modely špičkové úrovně.
Pro kontext: průměrný lidský účastník takovýchto soutěží se pohybuje okolo 20–30 %.
Rychlá odpověď: Nejčastější otázky o MiniMax M2.7
Co MiniMax M2.7 umí nejlépe?
Softwarové inženýrství end-to-end (SWE-Pro 56,22 %), kancelářská produktivita v Excelu/Wordu/PPT (GDPval-AA Elo 1 495), finanční analýza autonomně, multi-agentní spolupráce a rekurzivní sebezdokonalování.
Je MiniMax M2.7 lepší než ChatGPT na kódování?
Na SWE-Pro benchmarku dosahuje M2.7 56,22 % — srovnatelně s GPT-5.3-Codex. Na PinchBench (86,2 %) je jen 1,2 procentního bodu za Claude Opus 4.6. Za zlomkovou cenu.
Co je Agent Teams v MiniMax M2.7?
Nativní funkce pro koordinovanou spolupráci více AI agentů na jednom projektu, kde každý agent má specifickou roli, nástroje a odpovědnost.
Jak MiniMax M2.7 pomáhá s Excelem a finančním modelováním?
M2.7 autonomně čte výroční zprávy, sestavuje revenue forecast modely, provádí vícekolové revize dokumentů a generuje prezentace — s 97% mírou dodržování instrukcí.
Kolik stojí MiniMax M2.7?
$0,30 za milion vstupních tokenů a $1,20 za milion výstupních tokenů. To je přibližně 8 % ceny Claude Sonnet nebo GPT-5.4 při srovnatelném výkonu.
Umí MiniMax M2.7 sám sebe vylepšit?
Ano — M2.7 byl první model, který hluboce participoval na vlastním vývoji. Autonomně zvládl 30–50 % vlastního R&D workflow a dosáhl 30% zlepšení výkonu po 100+ iteračních cyklech.
Co to znamená pro firmy v praxi?
Podívejme se, co se změnilo pro konkrétní oddělení:
IT a vývoj: Místo junior vývojáře na rutinní úkoly — M2.7 agent zvládne debugging, code review i celé feature deliveries end-to-end.
Finance: Automatická příprava analytických reportů, finančních modelů a prezentací z veřejně dostupných dat — bez konzultanta.
Operations: Multi-agentní týmy zpracovávají objednávky, faktury a dokumenty paralelně, 24/7.
Management: Monitoring systémů s automatickým řešením incidentů do 3 minut.
Cena za milion tokenů ($0,30) znamená, že tyto schopnosti jsou dostupné pro firmy jakékoliv velikosti — ne jen pro korporace s miliardovými rozpočty.
Shrnutí schopností M2.7 na jednom místě
| Oblast |
Co zvládne |
Benchmark |
| Softwarové inženýrství |
Celý dev lifecycle, debug živých systémů |
SWE-Pro 56,22 % |
| End-to-end projekty |
Web, Android, iOS, backend od nuly |
VIBE-Pro 55,6 % |
| Kancelářská produktivita |
Excel, Word, PPT — vícekolové revize |
GDPval-AA Elo 1 495 |
| Finanční analýza |
Autonomní reporty, forecast modely |
Nejlepší mezi open modely |
| Multi-agent spolupráce |
Koordinované AI týmy |
97 % skill adherence |
| Sebezdokonalování |
Autonomní iterace vlastního kódu |
+30 % výkon po 100 cyklech |
| ML soutěže |
Autonomní účast a optimalizace |
66,6 % míra medailí |
| Cena |
— |
$0,30 / $1,20 za 1M tokenů |
Pokud chcete zjistit, jak konkrétně nasadit M2.7 nebo jiné AI agenty do procesů vaší firmy — od automatizace faktur přes vývoj až po finanční reporting — rádi vám pomůžeme najít ten správný přístup.
👉 Rezervujte bezplatnou konzultaci s Apertia.ai