OpenAI představilo Sora 2 – novou generaci AI modelu pro generování videí a zvuku. Spolu s technologickým upgradem přišla také sociální aplikace, která podle slov CEO Sama Altmana představuje „ChatGPT moment pro kreativitu“. Během prvních 24 hodin se Sora stala nejstahovanější aplikací v kategorii Photo & Video na iOS App Store.
Co je Sora 2
Sora 2 představuje evoluční skok od původního modelu, který OpenAI poprvé ukázal v únoru 2024 a veřejnosti zpřístupnil až v prosinci téhož roku.
- Délka videa: Až 20 sekund v high-definition kvalitě
- Synchronizované audio: Automatické generování dialogů, zvukových efektů a ambientních zvuků
- Fyzikální realismus: Zlepšená simulace fyzikálních zákonů (gravitace, momentum, kolize)
- Steerability: Pokročilá kontrola nad kamerovými pohyby, stylem a více-scénovými sekvencemi
- Stylová variabilita: Od fotorealismu přes anime až po surrealistické výstupy
Technologický pokrok oproti Sora 1
OpenAI přirovnává původní Soru k „GPT-1 momentu“ pro video – prvnímu okamžiku, kdy generování videa začalo vypadat použitelně. Sora 2 podle společnosti představuje posun blíže k „GPT-3.5 momentu“ s výrazně pokročilejšími schopnostmi.
- Fyzikální simulace: Místo "teleportování" míče do koše dokáže Sora 2 realisticky zobrazit odraz od desky při neúspěšném pokusu. Model lépe respektuje momentum, plovatelnost a další fyzikální vlastnosti.
- Objektová konzistence Schopnost udržet konzistentní vzhled objektů a postav napříč více záběry a pohyby kamery, což bylo slabinou prvního modelu.
- Audio-video synchronizace Na rozdíl od konkurence generuje Sora 2 video a zvuk společně, ne odděleně. To vytváří koherentnější výsledek bez nutnosti post-produkčního zvukového mixu.
- Multi-shot storyboarding Schopnost následovat složité instrukce pokrývající více záběrů při zachování konzistence světa a příběhu.
Sora aplikace: Sociální síť pro AI videa
OpenAI nelancovalo jen model, ale kompletní ekosystém inspirovaný TikTokem a Instagram Reels.
Hlavní funkce aplikace
Funkce | Popis | Praktické využití |
Create | Generování videí z textového popisu nebo obrázku | Základní tvorba obsahu, rychlé prototypování nápadů |
Remix | Modifikace existujících videí od jiných uživatelů | Kolaborativní tvorba, iterace na úspěšných konceptech |
Cameos | Vložení vlastní podoby do generovaných videí | Personalizovaný obsah, virální trendy |
Feed (For You) | Personalizovaný feed zaměřený na inspiraci k tvorbě | Objevování stylů, učení se od komunity |
Direct Messages | Sdílení videí s vybranými uživateli | Privátní spolupráce, testování před publikací |
Cameos: Revoluční funkce s etickými otazníky
Jak Cameos funguje
- Jednorázové nahrání: Uživatel nahraje krátké video a zvukovou stopu pro zachycení své podoby a hlasu
- Liveness check: OpenAI provádí ověření autenticity pomocí zvukových výzev pro prevenci deepfake zneužití
- Granulární oprávnění: Uživatel kontroluje, kdo může použít jeho podobu (jen já, vybraní přátelé, vzájemní kontakty, všichni)
- Právo na smazání: Uživatel může kdykoliv smazat jakékoliv video obsahující jeho podobu, včetně nepublikovaných konceptů
- Customizace: Možnost upravit, jak model zobrazuje uživatele (oprava halucinací v oblečení, akcent atd.)
Během interního testování v OpenAI zaměstnanci reportovali, že díky funkci Cameos poznávali nové kolegy, se kterými by se jinak nesetkali – vytváří se nová sociální dynamika založená na kreativní spolupráci.
Principy odpovědného vývoje podle Sama Altmana
CEO OpenAI Sam Altman ve svém blogu otevřeně diskutuje jak pozitiva, tak rizika spojená se Sora 2.
„Social media has had some good effects on the world, but it’s also had some bad ones. We are aware of how addictive a service like this could become, and we can imagine many ways it could be used for bullying.“
— Sam Altman, CEO OpenAI
- Optimalizace pro dlouhodobou spokojenost Většina uživatelů by měla po 6 měsících cítit, že jejich život je s použitím Sora lepší. Pokud ne, OpenAI udělá významné změny nebo službu ukončí.
- Kontrola nad feedem Uživatelé mohou říct Soře, co chtějí vidět – relaxační obsah, energizující videa, specifické zájmy, časové limity. Rodičovská kontrola umožňuje vypnout personalizaci.
- Priorita tvorby Zaměření na to, aby bylo vytváření obsahu snadné a odměňující pro všechny. Víra, že lidé jsou přirozenými tvůrci a tvorba je klíčová pro životní spokojenost.
- Podpora dlouhodobých cílů Snaha pochopit skutečné cíle uživatelů a pomoci jim jich dosáhnout – od lepších vztahů přes fitness až po podnikání.
Etické obavy a mitigace
- Riziko závislosti: Altman otevřeně mluví o možnosti vytvoření "RL-optimized slop feed" – algoritmu, který maximalizuje čas strávaný v aplikaci na úkor kvality života uživatele.
- Prevence bullying: Tým pracuje na ochranách proti zneužití, včetně pravidelných kontrol dopadu na náladu a wellbeing uživatelů.
- Deepfake prevence: Ochrana proti zneužití podoby jiných osob bez souhlasu, omezení na veřejné osobnosti.
Právní situace
- Aktuální soudní spory: OpenAI čelí žalobám od autorů včetně Ta-Nehisi Coates a Jodi Picoult, novin jako New York Times a dalších držitelů autorských práv.
- Precedens: Konkurent Anthropic nedávno souhlasil s vyplacením $1.5 miliardy v rámci dohody s autory, kteří tvrdili, že společnost nelegálně stáhla a použila jejich knihy pro trénink AI modelů.
- Právní nejasnost: Rozdíl mezi použitím chráněného obsahu jako vstupu pro trénink modelů vs. generování výstupů, které zobrazují chráněný obsah, zůstává právně nejasný.
„Since Sora 2’s release, videos that infringe our members‘ films, shows, and characters have proliferated on OpenAI’s service and across social media.“
— Charles Rivkin, CEO Motion Picture Association
OpenAI nejedná s Hollywoodem
Na rozdíl od konkurenčního Runway, které uzavřelo partnerství s Lionsgate pro plné oprávnění používat jejich filmy k trénování AI modelů, OpenAI zatím nemá žádnou takovou dohodu s velkými studii. To naznačuje, že priority OpenAI leží jinde než v profesionální filmové produkci.
Srovnání s konkurencí
Trh AI video generátorů se během roku 2025 významně rozšířil. Jak se Sora 2 vyrovnává konkurentům?
Model | Max. délka | Audio | Fyzika | Primární výhoda |
Sora 2 (OpenAI) | 20 sekund | ✓ Syntetické | Pokročilé | Nejdelší videa, best-in-class fyzika, cameos |
Runway Gen-4 | 10 sekund | ✓ Generované | Dobré | Profesionální nástroje, partnerství s Lionsgate |
Veo 3 (Google) | ~10 sekund | ✗ Zatím ne | Dobré | Trénované na YouTube data, integrace s Google |
Kling AI | 5 sekund | ✗ Ne | Základní | Rychlé generování, nižší cena |
Luma Dream Machine | 5 sekund | ✗ Ne | Střední | Velmi rychlá generace (30s) |
Nová éra kreativity nebo Pandořina skříňka?
Sora 2 představuje nepopiratelně významný technologický skok v oblasti AI generování videa. 20sekundová videa s profesionální kvalitou, synchronizovaným zvukem a pokročilou fyzikální simulací jsou realita dostupná každému s přístupem k aplikaci.
Sam Altman to nazývá „ChatGPT momentem pro kreativitu“ – obdobou spuštění ChatGPT v listopadu 2022, která změnila způsob, jakým lidé přistupují k psanému obsahu. Jestli se Sora 2 stane takovým momentem pro video, ukáže až čas.
Klíčové otázky zůstávají nezodpovězené
- Jak budou vyřešeny copyright spory s Hollywood studii?
- Dokáže OpenAI skutečně zabránit vytvoření návykového "slop feed"?
- Jak rychle se technologie stane dostupnou široké veřejnosti (mimo invite-only)?
- Jaká bude cenová struktura API a produkčního použití?
Jedna věc je jistá: hranice mezi skutečným a umělým obsahem se právě dramaticky posunula. Ať už to povede k „Cambrian explosion of creativity“, jak předpovídá Altman, nebo k dystopickému světu plnému deepfakes a algoritmicky optimalizovaného obsahu, závisí na rozhodnutích, která jako společnost uděláme v příštích měsících a letech.