Az a modell, amely elsőként lépte át a 15%-os határt az extrém nehéz ARC AGI 2.0 teszten. És az a modell, amely állítólag okosabb, mint a posztgraduális hallgatók egész generációja. Ez a Grok 4, az xAI legújabb mesterséges intelligenciája.
Míg sok nyelvi modell a paraméterszámmal és a multimodalitással csábít, a Grok 4 más utat választ. A teljesítményt olyan architektúrával ötvözi, amely mély megértésre, deduktív érvelésre és a fejlesztők napi munkájának támogatására lett tervezve. Ebben a cikkben megnézzük, hogyan teljesít a Grok a gyakorlatban – és mindenekelőtt mit kínál azoknak a programozóknak, akik többet keresnek, mint egy automatikus szintaxisgenerátort.
Umělá inteligenceJuly 11, 2025|2 min
A Grok 4‑gyel a fejlesztés gyorsabb, okosabb és élőbb
Az a modell, amely elsőként lépte át a 15%-os határt az extrém nehéz ARC AGI 2.0 teszten. És az a modell, amely állítólag okosabb, mint a posztgraduális hallgatók egész generációja...
T
Tým Apertia
Apertia.ai
Share:
Want a Custom AI Solution?
We help companies automate processes with AI. Contact us to find out how we can help you.
- Response within 24 hours
- No-obligation consultation
- Solutions tailored to your business
A Grok 4 15,3%-ot ért el az ARC AGI 2.0 teszten – ez a legnehezebb általános intelligenciatesztek egyike, amely a logikai, matematikai és nyelvi feladatok megoldási képességére fókuszál, hasonlóan az IQ‑tesztekhez. Összehasonlításképp: a GPT‑4 nagyjából 13% körül teljesít, a Gemini 2.5 Pro és a Claude 3 Opus pedig enyhén ez alatt a küszöb alatt helyezkedik el.
Ez az eredmény megerősíti a magas szintű reasoning‑képességet, vagyis a logikai érvelést – ami kulcsfontosságú azoknál a fejlesztői feladatoknál, amelyek többet igényelnek puszta szintaxisgenerálásnál. ARC benchmark – Allen Institute for AI
Ezek az eredmények azt mutatják, hogy a Grok 4 nem csupán PR‑termék, hanem ténylegesen a piac legjobb modelljei közé tartozik, amelyek képesek nagy komplexitású feladatok és nem determinisztikus szcenáriók megoldására.
A fejlesztők számára ez azt jelenti, hogy a modell jobban érti a szándékot, felméri a logikai összefüggéseket, és képes kontextusban megoldásokat javasolni – nem csupán megtanult minták alapján.
| Modell | ARC AGI 2.0 pontszám | HumanEval | Codeforces rang |
|---|---|---|---|
| Grok 4 | 15,3 % | 75–78 % | Master (~2100) |
| GPT-4 (OpenAI) | 12–14 % | 67–72 % | Candidate Master |
| Claude 3 Opus | 10–11 % | 70–75 % | ~Expert |
| Gemini 2.5 Pro | 13 % | 76–80 % | Master |
Ready to start?
Interested in this article?
Let's explore together how AI can transform your business.
Contact us


