30. září 2025 OpenAI představilo Sora 2 – novou generaci AI modelu pro generování videí a zvuku. Spolu s technologickým upgradem přišla také sociální aplikace, která podle slov CEO Sama Altmana představuje „ChatGPT moment pro kreativitu“. Během prvních 24 hodin se Sora stala nejstahovanější aplikací v kategorii Photo & Video na iOS App Store.
Co je Sora 2
Sora 2 představuje evoluční skok od původního modelu, který OpenAI poprvé ukázal v únoru 2024 a veřejnosti zpřístupnil až v prosinci téhož roku.
Klíčové technické charakteristiky
Délka videa: Až 20 sekund v high-definition kvalitě
Synchronizované audio: Automatické generování dialogů, zvukových efektů a ambientních zvuků
Fyzikální realismus: Zlepšená simulace fyzikálních zákonů (gravitace, momentum, kolize)
Steerability: Pokročilá kontrola nad kamerovými pohyby, stylem a více-scénovými sekvencemi
Stylová variabilita: Od fotorealismu přes anime až po surrealistické výstupy
Technologický pokrok oproti Sora 1
OpenAI přirovnává původní Soru k „GPT-1 momentu“ pro video – prvnímu okamžiku, kdy generování videa začalo vypadat použitelně. Sora 2 podle společnosti představuje posun blíže k „GPT-3.5 momentu“ s výrazně pokročilejšími schopnostmi.
Fyzikální simulace
Místo „teleportování“ míče do koše dokáže Sora 2 realisticky zobrazit odraz od desky při neúspěšném pokusu. Model lépe respektuje momentum, plovatelnost a další fyzikální vlastnosti.
Objektová konzistence
Schopnost udržet konzistentní vzhled objektů a postav napříč více záběry a pohyby kamery, což bylo slabinou prvního modelu.
Audio-video synchronizace
Na rozdíl od konkurence generuje Sora 2 video a zvuk společně, ne odděleně. To vytváří koherentnější výsledek bez nutnosti post-produkčního zvukového mixu.
Multi-shot storyboarding
Schopnost následovat složité instrukce pokrývající více záběrů při zachování konzistence světa a příběhu.
Sora aplikace: Sociální síť pro AI videa
OpenAI nelancovalo jen model, ale kompletní ekosystém inspirovaný TikTokem a Instagram Reels.
Hlavní funkce aplikace
Funkce | Popis | Praktické využití |
---|---|---|
Create | Generování videí z textového popisu nebo obrázku | Základní tvorba obsahu, rychlé prototypování nápadů |
Remix | Modifikace existujících videí od jiných uživatelů | Kolaborativní tvorba, iterace na úspěšných konceptech |
Cameos | Vložení vlastní podoby do generovaných videí | Personalizovaný obsah, virální trendy |
Feed (For You) | Personalizovaný feed zaměřený na inspiraci k tvorbě | Objevování stylů, učení se od komunity |
Direct Messages | Sdílení videí s vybranými uživateli | Privátní spolupráce, testování před publikací |
Cameos: Revoluční funkce s etickými otazníky
Jak Cameos funguje
1. Jednorázové nahrání: Uživatel nahraje krátké video a zvukovou stopu pro zachycení své podoby a hlasu
2. Liveness check: OpenAI provádí ověření autenticity pomocí zvukových výzev pro prevenci deepfake zneužití
3. Granulární oprávnění: Uživatel kontroluje, kdo může použít jeho podobu (jen já, vybraní přátelé, vzájemní kontakty, všichni)
4. Právo na smazání: Uživatel může kdykoliv smazat jakékoliv video obsahující jeho podobu, včetně nepublikovaných konceptů
5. Customizace: Možnost upravit, jak model zobrazuje uživatele (oprava halucinací v oblečení, akcent atd.)
Během interního testování v OpenAI zaměstnanci reportovali, že díky funkci Cameos poznávali nové kolegy, se kterými by se jinak nesetkali – vytváří se nová sociální dynamika založená na kreativní spolupráci.
Principy odpovědného vývoje podle Sama Altmana
CEO OpenAI Sam Altman ve svém blogu otevřeně diskutuje jak pozitiva, tak rizika spojená se Sora 2.
Čtyři pilíře odpovědného produktu
1. Optimalizace pro dlouhodobou spokojenost
Většina uživatelů by měla po 6 měsících cítit, že jejich život je s použitím Sora lepší. Pokud ne, OpenAI udělá významné změny nebo službu ukončí.
2. Kontrola nad feedem
Uživatelé mohou říct Soře, co chtějí vidět – relaxační obsah, energizující videa, specifické zájmy, časové limity. Rodičovská kontrola umožňuje vypnout personalizaci.
3. Priorita tvorby
Zaměření na to, aby bylo vytváření obsahu snadné a odměňující pro všechny. Víra, že lidé jsou přirozenými tvůrci a tvorba je klíčová pro životní spokojenost.
4. Podpora dlouhodobých cílů
Snaha pochopit skutečné cíle uživatelů a pomoci jim jich dosáhnout – od lepších vztahů přes fitness až po podnikání.
Etické obavy a mitigace
Riziko závislosti: Altman otevřeně mluví o možnosti vytvoření „RL-optimized slop feed“ – algoritmu, který maximalizuje čas strávaný v aplikaci na úkor kvality života uživatele.
Prevence bullying: Tým pracuje na ochranách proti zneužití, včetně pravidelných kontrol dopadu na náladu a wellbeing uživatelů.
Deepfake prevence: Ochrana proti zneužití podoby jiných osob bez souhlasu, omezení na veřejné osobnosti.
Kontroverze: Copyright v éře AI
Launch Sora 2 vyvolal okamžitou vlnu kontroverzí ohledně autorských práv a používání chráněného obsahu.
Timeline kontroverze
OpenAI oznámilo, že držitelé autorských práv musí aktivně „opt-out“, pokud nechtějí, aby jejich obsah byl použit v Soře.
Internet zaplavily videa s Mario Kartem, Pikachu v Saving Private Ryan, vlastní epizody South Parku, Pokémon postavy a další chráněný obsah.
Sam Altman oznámil změnu strategie: místo opt-out bude vyžadováno opt-in pro použití existujících postav a licencovaného obsahu.
Motion Picture Association (MPA) požaduje „okamžitou akci“ a tvrdí, že opt-out systém nezbavuje OpenAI odpovědnosti za porušování autorských práv.
Talent agency WME oznámila, že všichni jejich klienti budou automaticky „opted-out“ ze Sora 2.
Právní situace
Aktuální soudní spory: OpenAI čelí žalobám od autorů včetně Ta-Nehisi Coates a Jodi Picoult, novin jako New York Times a dalších držitelů autorských práv.
Precedens: Konkurent Anthropic nedávno souhlasil s vyplacením $1.5 miliardy v rámci dohody s autory, kteří tvrdili, že společnost nelegálně stáhla a použila jejich knihy pro trénink AI modelů.
Právní nejasnost: Rozdíl mezi použitím chráněného obsahu jako vstupu pro trénink modelů vs. generování výstupů, které zobrazují chráněný obsah, zůstává právně nejasný.
OpenAI nejedná s Hollywoodem
Na rozdíl od konkurenčního Runway, které uzavřelo partnerství s Lionsgate pro plné oprávnění používat jejich filmy k trénování AI modelů, OpenAI zatím nemá žádnou takovou dohodu s velkými studii. To naznačuje, že priority OpenAI leží jinde než v profesionální filmové produkci.
Praktické schopnosti a limity
Co Sora 2 zvládá dobře
Krátká sociální videa
Ideální pro Instagram Reels, TikTok, YouTube Shorts – vertikální 20sekundová videa s vysokou kvalitou a synchronizovaným zvukem.
Stylizované koncepty
Excaluje v různých vizuálních stylech – od hyperrealistického přes anime až po surrealistické umělecké vize.
Fyzikálně věrohodné akce
Gymnastické prvky, water sports, běžné denní aktivity – vše s respektem k fyzikálním zákonům.
Kamerové pohyby
Reliabilní následování instrukcí ohledně typu kamery, pohybů, osvětlení a kinematografického mood.
Kde Sora 2 selhává
Dokumentované limity
- Skupinové scény: Problémy se scénami s mnoha mluvícími lidmi najednou
- Složité kolize: Komplexní interakce mezi více objekty mohou vykazovat artefakty
- Rychlé kamerové pohyby: Velmi rychlé pohyby kamery způsobují nekonsistence
- Délkové omezení: Maximum 20 sekund – pro delší obsah nutné spojovat více klipů
- Ruce a prsty: Stále občasně halucinuje divné pozice nebo počty prstů
- Dlouhodobá konzistence: Obtíže s udržením přesných detailů napříč delšími sekvencemi
Srovnání s konkurencí
Trh AI video generátorů se během roku 2025 významně rozšířil. Jak se Sora 2 vyrovnává konkurentům?
Model | Max. délka | Audio | Fyzika | Primární výhoda |
---|---|---|---|---|
Sora 2 (OpenAI) | 20 sekund | ✓ Syntetické | Pokročilé | Nejdelší videa, best-in-class fyzika, cameos |
Runway Gen-4 | 10 sekund | ✓ Generované | Dobré | Profesionální nástroje, partnerství s Lionsgate |
Veo 3 (Google) | ~10 sekund | ✗ Zatím ne | Dobré | Trénované na YouTube data, integrace s Google |
Kling AI | 5 sekund | ✗ Ne | Základní | Rychlé generování, nižší cena |
Luma Dream Machine | 5 sekund | ✗ Ne | Střední | Velmi rychlá generace (30s) |
Pozice Sora 2 na trhu
Výhody: Nejdelší videa v kategorii (20s), nejlepší fyzikální simulace, jedinečná cameo funkce, synchronizované audio, silná brand recognition OpenAI
Nevýhody: Omezený přístup (invite-only), nejasná cenová struktura, copyright kontroverze, absence profesionálních nástrojů pro editaci
Budoucí vývoj
Plánované funkce
Sora 2 Pro
Vyšší kvalita pro náročnější záběry, dostupné pro ChatGPT Pro subscribery přes sora.com a později v aplikaci.
API přístup
Plánované zpřístupnění přes API pro vývojáře a automatizované workflow, zatím bez konkrétního data.
Android verze
Aplikace pro Android je ve vývoji, aktuálně dostupná jen iOS.
Rozšířené editační nástroje
Plánované pokročilé nástroje pro post-produkci přímo v aplikaci.
Dlouhodobá vize
OpenAI vidí Sora 2 jako krok směrem k AI systémům, které dokážou přesněji simulovat fyzikální svět. Takové systémy by mohly být klíčové pro trénink AI modelů, které hluboce rozumí reálnému světu a dokážou v něm fungovat.
Dopad na kreativní průmysl
Pozitiva
- Demokratizace produkce: Profesionální kvalita videa dostupná běžným lidem bez drahého vybavení
- Rapid prototyping: Rychlé testování nápadů před investicí do plné produkce
- Nové formy umění: Vytváření typů obsahu, které dříve nebyly technicky možné
- Kolaborativní tvorba: Funkce Remix a Cameos podporují spolupráci mezi tvůrci
- Vzdělávací obsah: Snadnější vytváření vizualizací pro výuku a vysvětlování konceptů
Rizika a obavy
- Ztráta pracovních míst: Potenciální dopad na profesionální videografy, animátory, střihače
- Dezinformace: Možnost vytváření přesvědčivých falešných videí s reálnými osobami
- Copyright chaos: Nejasná právní situace ohledně použití chráněného obsahu
- Závislost a duševní zdraví: Riziko vytvoření návykového „slop feed“ optimalizovaného pro engagement
- Eroze důvěry: Stále tenčí linie mezi skutečným a AI-generovaným obsahem
- Kulturní homogenizace: Riziko, že všechen obsah bude vypadat podobně
Nová éra kreativity nebo Pandořina skříňka?
Sora 2 představuje nepopiratelně významný technologický skok v oblasti AI generování videa. 20sekundová videa s profesionální kvalitou, synchronizovaným zvukem a pokročilou fyzikální simulací jsou realita dostupná každému s přístupem k aplikaci.
Sam Altman to nazývá „ChatGPT momentem pro kreativitu“ – obdobou spuštění ChatGPT v listopadu 2022, která změnila způsob, jakým lidé přistupují k psanému obsahu. Jestli se Sora 2 stane takovým momentem pro video, ukáže až čas.
Klíčové otázky zůstávají nezodpovězené
- Jak budou vyřešeny copyright spory s Hollywood studii?
- Dokáže OpenAI skutečně zabránit vytvoření návykového „slop feed“?
- Jak rychle se technologie stane dostupnou široké veřejnosti (mimo invite-only)?
- Jaká bude cenová struktura API a produkčního použití?
- Jak se regulátoři postaví k AI-generovanému obsahu a deepfakům?
Jedna věc je jistá: hranice mezi skutečným a umělým obsahem se právě dramaticky posunula. Ať už to povede k „Cambrian explosion of creativity“, jak předpovídá Altman, nebo k dystopickému světu plnému deepfakes a algoritmicky optimalizovaného obsahu, závisí na rozhodnutích, která jako společnost uděláme v příštích měsících a letech.