AI modely & technologie20 mars 2026|8 min

MiniMax M2.7: Co přesně tento model umí

Čínský AI startup MiniMax vydal model M2.7 se schopnostmi, které dosud žádný veřejně dostupný model nepředvedl. Podívejte se na přesný přehled toho, co umí nejlépe.

Tým Apertia

Apertia.ai

Čínský AI startup MiniMax vydal model M2.7. Technická komunita po celém světě si okamžitě všimla jednoho: tohle není jen "lepší verze předchozího modelu." M2.7 má schopnosti, které dosud žádný veřejně dostupný model nepředvedl — a výsledky na světových benchmarcích to potvrzují.

Tady je přesný přehled toho, co M2.7 umí nejlépe — s čísly ze zahraničních zdrojů.

Softwarové inženýrství na úrovni senior vývojáře

Toto je pravděpodobně nejsilnější oblast M2.7 a důvod, proč o něm vývojáři mluví jako o průlomu.

Model neslouží jen ke generování kódu. Podle oficiální dokumentace MiniMax a nezávislých testů platformy Kilo.ai zvládá M2.7 celý vývojový životní cyklus:

návrh systému od nuly (0 → 1)
iterace a rozšiřování funkcionality (1 → 10 → 90)
code review a systémové testování (90 → 100)
plná podpora pro Web, Android, iOS a Windows projekty

Co říkají čísla

Benchmark	Co měří	Výsledek M2.7
SWE-Pro	Reálné softwarové inženýrství	56,22 % (srovnatelné s GPT-5.3-Codex)
VIBE-Pro	Dodání celého projektu end-to-end	55,6 % (srovnatelné s Claude Opus 4.6)
Terminal Bench 2	Porozumění komplexním inženýrským systémům	57,0 %
SWE Multilingual	Vícejazyčné programování	76,5
PinchBench (Kilo.ai)	Agentic AI coding	86,2 % (jen 1,2 % za Claude Opus 4.6)

Kilo.ai, která M2.7 testovala nezávisle, to popsala takto: M2.7 před psaním kódu čte obšírně kontext — stahuje okolní soubory, analyzuje závislosti, mapuje celé call chains. Díky tomu nachází chyby, které jiné modely přehlédnou.

A co je klíčové pro produkční prostředí: když v živém systému nastanou výpadky, M2.7 dokáže korelovat monitorovací metriky s deployment timeline, analyzovat trace sampling, navrhnout přesnou hypotézu, připojit se k databázi a ověřit příčinu. Přitom ihned nasadí dočasnou opravu, zatímco připravuje merge request. Výsledkem je zkrácení doby obnovy produkčního systému na méně než tři minuty.

Kancelářská produktivita: Excel, Word, PowerPoint na expert úrovni

Druhá oblast, kde M2.7 dominuje, je komplexní práce s kancelářskými dokumenty. Ne jednoduché úpravy — mluvíme o vícenásobných revizích, finančních modelech a analytických výstupech.

Na GDPval-AA benchmarku dosahuje M2.7 Elo skóre 1 495 — nejvyšší mezi open-source přístupnými modely, hned za Claude Opus 4.6, Sonnet 4.6 a GPT-5.4.

Co konkrétně zvládne

Excel: Finanční modelování na úrovni průmyslových expertů. Neuronad.com to popisuje konkrétně: zadáte cíl jako „analyzuj TSMC" — a M2.7 autonomně přečte výroční zprávy, earnings cally, zkříží je s externím výzkumem, sestaví vlastní model příjmů a vygeneruje výsledný report i prezentaci. Celé to opraví samo, pokud na chybu upozorníte.

Word a PowerPoint: Vícekolové revize s vysokou věrností. Model si pamatuje kontext mezi úpravami a neztrácí konzistenci při opakovaných změnách.

Instrukce: M2.7 udržuje 97% míru dodržování instrukcí při práci s více než 40 komplexními dovednostmi, každá přes 2 000 tokenů. To znamená: dáte mu složitý, vícevrstvý úkol — a on ho dokončí přesně tak, jak jste chtěli, bez zkratek.

Multi-agentní spolupráce — AI týmy, které pracují autonomně

Toto je novinka, která nemá v dosavadních modelech srovnání.

M2.7 přináší nativní Agent Teams — schopnost nasadit koordinované týmy AI agentů, kde každý agent plní specifickou roli. Nemluvíme o jednom chatbotu, který přepíná kontexty. Mluvíme o distribuovaném systému, kde agenti spolupracují jako skutečný tým.

Praktický příklad z MiniMax výzkumného týmu: agent začne diskusí o experimentální myšlence, pomůže s literárním přehledem, sleduje specifikaci experimentu, zpracovává data a spouští experimenty. Během experimentů autonomně monitoruje průběh, spouští log analysis, debugging, analýzu metrik, opravy kódu a smoke testy — identifikuje a konfiguruje jemné, ale klíčové změny, které by dříve vyžadovaly spolupráci více lidských výzkumníků z různých týmů.

Pro firmu to znamená

Agent pro příjem a zpracování objednávek
Agent pro analýzu dokumentů a faktur
Agent pro monitoring systémů a incidenty
Agent pro reporting a prezentace pro management

Všichni pracují současně, koordinovaně, bez přestávek.

Finanční analýza jako junior analytik

Toto je use case, který zaujal globální finanční komunitu.

V oblasti financí M2.7 funguje jako junior analytik — autonomně čte výroční zprávy, sestavuje modely příjmů a generuje analytické reporty.

Konkrétní workflow podle Neuronad.com:

Vous souhaitez une solution IA sur mesure ?

Nous aidons les entreprises à automatiser leurs processus avec l'IA. Contactez-nous pour découvrir comment nous pouvons vous aider.

Réponse sous 24 heures
Consultation sans engagement
Solutions adaptées à votre entreprise

Zadáte ticker nebo název firmy
M2.7 autonomně stáhne a přečte výroční zprávy a earnings cally
Zkříží je s externími zdroji a výzkumem
Sestaví vlastní revenue forecast model v Excelu
Vygeneruje polished prezentaci v PowerPointu
Opraví chyby na základě vašeho feedbacku

Bez jediné instrukce navíc. End-to-end.

Sebezdokonalování — schopnost, která nemá precedent

Tohle je vlastnost, která M2.7 odlišuje od úplně všeho, co bylo vydáno před ním.

MiniMax použil M2.7 k tomu, aby model sám budoval, monitoroval a optimalizoval vlastní reinforcement learning harnesses. Tím se přesunul k rekurzivnímu sebezdokonalování — budoucnosti, kde modely jsou stejně tak architekty vlastního pokroku jako produktem lidského výzkumu.

Jak to vypadalo v praxi

M2.7 byl nasazen do autonomní iterační smyčky: analyzuj selhání → naplánuj změny → uprav scaffold kód → spusť evaluace → porovnej výsledky → rozhodni, zda změny zachovat nebo vrátit. Tuto smyčku opakoval přes 100 kol.

Výsledek: 30% zlepšení výkonu na interních evaluačních sadách. A model přitom zvládl 30–50 % celého výzkumného workflow zcela autonomně.

Soutěže ve strojovém učení — 66,6% míra medailí

Tohle číslo zastavilo pozornost celé AI komunity.

MiniMax testoval M2.7 v reálných soutěžích strojového učení. Podmínky: omezené zdroje, jeden GPU A30, 24 hodin na úkol.

M2.7 se zúčastnil 22 soutěží strojového učení. S využitím krátkodobé paměti, self-feedbacku a self-optimalizace dosáhl míry medailí 66,6 % — což ho řadí mezi modely špičkové úrovně.

Pro kontext: průměrný lidský účastník takovýchto soutěží se pohybuje okolo 20–30 %.

Rychlá odpověď: Nejčastější otázky o MiniMax M2.7

Co MiniMax M2.7 umí nejlépe?

Softwarové inženýrství end-to-end (SWE-Pro 56,22 %), kancelářská produktivita v Excelu/Wordu/PPT (GDPval-AA Elo 1 495), finanční analýza autonomně, multi-agentní spolupráce a rekurzivní sebezdokonalování.

Je MiniMax M2.7 lepší než ChatGPT na kódování?

Na SWE-Pro benchmarku dosahuje M2.7 56,22 % — srovnatelně s GPT-5.3-Codex. Na PinchBench (86,2 %) je jen 1,2 procentního bodu za Claude Opus 4.6. Za zlomkovou cenu.

Co je Agent Teams v MiniMax M2.7?

Nativní funkce pro koordinovanou spolupráci více AI agentů na jednom projektu, kde každý agent má specifickou roli, nástroje a odpovědnost.

Jak MiniMax M2.7 pomáhá s Excelem a finančním modelováním?

M2.7 autonomně čte výroční zprávy, sestavuje revenue forecast modely, provádí vícekolové revize dokumentů a generuje prezentace — s 97% mírou dodržování instrukcí.

Kolik stojí MiniMax M2.7?

$0,30 za milion vstupních tokenů a $1,20 za milion výstupních tokenů. To je přibližně 8 % ceny Claude Sonnet nebo GPT-5.4 při srovnatelném výkonu.

Umí MiniMax M2.7 sám sebe vylepšit?

Ano — M2.7 byl první model, který hluboce participoval na vlastním vývoji. Autonomně zvládl 30–50 % vlastního R&D workflow a dosáhl 30% zlepšení výkonu po 100+ iteračních cyklech.

Co to znamená pro firmy v praxi?

Podívejme se, co se změnilo pro konkrétní oddělení:

IT a vývoj: Místo junior vývojáře na rutinní úkoly — M2.7 agent zvládne debugging, code review i celé feature deliveries end-to-end.

Finance: Automatická příprava analytických reportů, finančních modelů a prezentací z veřejně dostupných dat — bez konzultanta.

Operations: Multi-agentní týmy zpracovávají objednávky, faktury a dokumenty paralelně, 24/7.

Management: Monitoring systémů s automatickým řešením incidentů do 3 minut.

Cena za milion tokenů ($0,30) znamená, že tyto schopnosti jsou dostupné pro firmy jakékoliv velikosti — ne jen pro korporace s miliardovými rozpočty.

Shrnutí schopností M2.7 na jednom místě

Oblast	Co zvládne	Benchmark
Softwarové inženýrství	Celý dev lifecycle, debug živých systémů	SWE-Pro 56,22 %
End-to-end projekty	Web, Android, iOS, backend od nuly	VIBE-Pro 55,6 %
Kancelářská produktivita	Excel, Word, PPT — vícekolové revize	GDPval-AA Elo 1 495
Finanční analýza	Autonomní reporty, forecast modely	Nejlepší mezi open modely
Multi-agent spolupráce	Koordinované AI týmy	97 % skill adherence
Sebezdokonalování	Autonomní iterace vlastního kódu	+30 % výkon po 100 cyklech
ML soutěže	Autonomní účast a optimalizace	66,6 % míra medailí
Cena	—	$0,30 / $1,20 za 1M tokenů

Pokud chcete zjistit, jak konkrétně nasadit M2.7 nebo jiné AI agenty do procesů vaší firmy — od automatizace faktur přes vývoj až po finanční reporting — rádi vám pomůžeme najít ten správný přístup.

👉 Rezervujte bezplatnou konzultaci s Apertia.ai

Intéressé par cet article ?

Explorons ensemble comment l'IA peut transformer votre entreprise.

Contactez-nous