OpenAI predstavilo Sora 2, novú generáciu
AI modelu na generovanie videí a zvuku. Spolu s technologickým upgradom prišla aj sociálna aplikácia, ktorú CEO Sam Altman označil ako
„ChatGPT moment pre kreativitu". Počas prvých 24 hodín sa Sora stala najstahovanejšou aplikáciou v kategórii Photo & Video na iOS App Store.
Čo je Sora 2
Sora 2 predstavuje evolučný skok oproti pôvodnému modelu, ktorý OpenAI prvýkrát ukázalo vo februári 2024.
- Dĺžka videa: až 20 sekúnd v HD kvalite.
- Synchronizované audio: automatické generovanie dialógov, zvukových efektov a ambientných zvukov.
- Fyzikálny realizmus: lepšia simulácia gravitácie, hybnosti a kolízií.
- Kontrola nad výstupom: pokročilé riadenie pohybu kamery, štýlu a viacscénových sekvencií.
- Štýlová variabilita: od fotorealizmu cez anime až po surrealistické výstupy.
Technologický pokrok oproti Sora 1
OpenAI prirovnáva pôvodnú Soru ku „GPT-1 momentu" pre video. Sora 2 má byť bližšie ku „GPT-3.5 momentu", teda k fáze, keď technológia začína byť prakticky použiteľná vo väčšom meradle.
- Fyzikálna simulácia: model lepšie rešpektuje hybnosť, odrazy, plávanie a ďalšie fyzikálne vlastnosti.
- Konzistencia objektov: postavy a objekty si lepšie držia vzhľad naprieč zábermi.
- Audio-video synchronizácia: video a zvuk vznikajú spoločne, nie oddelene.
- Multi-shot storyboarding: model vie nasledovať zložité inštrukcie cez viac záberov a udržať konzistentný svet aj príbeh.
Aplikácia Sora: sociálna sieť pre AI videá
OpenAI nespustilo iba model, ale celý ekosystém inšpirovaný TikTokom a Instagram Reels.
| Funkcia | Opis | Využitie |
| Create | Generovanie videí z textu alebo obrázka | Rýchla tvorba obsahu a prototypovanie nápadov |
| Remix | Úprava existujúcich videí | Spolupráca a iterácia nad úspešnými konceptmi |
| Cameos | Vloženie vlastnej podoby do generovaných videí | Personalizovaný obsah a virálne trendy |
| Feed | Personalizovaný feed zameraný na inšpiráciu | Objavovanie štýlov a učenie sa od komunity |
Cameos: revolučná funkcia s etickými otázkami
- Jednorazové nahratie: používateľ nahrá krátke video a zvuk na zachytenie podoby a hlasu.
- Liveness check: OpenAI overuje autenticitu, aby znížilo riziko deepfake zneužitia.
- Granulárne oprávnenia: používateľ určuje, kto môže použiť jeho podobu.
- Právo na zmazanie: používateľ môže odstrániť video obsahujúce jeho podobu.
- Customizácia: možnosť upraviť, ako model zobrazuje používateľa.
Princípy zodpovedného vývoja
Sam Altman otvorene hovorí o prínosoch aj rizikách. Sociálna aplikácia s AI videami môže podporiť kreativitu, no zároveň môže byť návyková alebo zneužiteľná na šikanu.
- Dlhodobá spokojnosť: používateľ by mal mať po mesiacoch pocit, že mu služba pomáha, nie škodí.
- Kontrola nad feedom: používatelia môžu ovplyvniť, čo chcú vidieť, a nastaviť limity.
- Priorita tvorby: cieľom je uľahčiť tvorbu, nie len pasívnu konzumáciu.
- Podpora cieľov: systém má pomáhať pri reálnych cieľoch používateľov.
Etické a právne obavy
- Riziko závislosti: OpenAI priznáva riziko algoritmov optimalizovaných na čas strávený v aplikácii.
- Prevencia šikany: tím pracuje na ochranách proti zneužitiu.
- Deepfake prevencia: ochrana pred použitím podoby bez súhlasu je kľúčová.
- Autorské práva: právna hranica medzi tréningom modelov a výstupmi zobrazujúcimi chránený obsah zostáva nejasná.
Sora 2 je výrazný krok pre kreatívnu AI. Zároveň ukazuje, že budúcnosť generovaného videa nebude iba technická otázka, ale aj sociálna, právna a etická téma.