OpenAI ha presentato Sora 2 – una nuova generazione di modello
AI per la generazione di video e audio. Insieme all’upgrade tecnologico è arrivata anche un’app sociale che, secondo il CEO Sam Altman, rappresenta un
“momento ChatGPT per la creatività”. Nelle prime 24 ore, Sora è diventata l’app più scaricata nella categoria Photo & Video su iOS App Store.
Che cos’è Sora 2
Sora 2 rappresenta un salto evolutivo rispetto al modello originale, che OpenAI ha mostrato per la prima volta nel febbraio 2024 e reso disponibile al pubblico solo nel dicembre dello stesso anno.
-
Durata del video: fino a 20 secondi in qualità high‑definition
-
Audio sincronizzato: generazione automatica di dialoghi, effetti sonori e suoni ambientali
-
Realismo fisico: simulazione migliorata delle leggi fisiche (gravità, momentum, collisioni)
-
Steerability: controllo avanzato dei movimenti di camera, stile e sequenze multi‑scena
-
Variabilità di stile: dal fotorealismo all’anime fino a risultati surreali
Progresso tecnologico rispetto a Sora 1
OpenAI paragona la prima Sora al “momento GPT‑1” per il video – il primo momento in cui la generazione video ha iniziato a sembrare utilizzabile. Sora 2, secondo l’azienda, è un passo più vicino al “momento GPT‑3.5” con capacità significativamente più avanzate.
-
Simulazione fisica: invece di “teletrasportare” la palla nel canestro, Sora 2 può mostrare in modo realistico il rimbalzo sul tabellone in caso di tiro mancato. Il modello rispetta meglio momentum, galleggiabilità e altre proprietà fisiche.
-
Coerenza degli oggetti: capacità di mantenere un aspetto coerente di oggetti e personaggi tra diverse inquadrature e movimenti di camera, una debolezza del primo modello.
-
Sincronizzazione audio‑video: a differenza della concorrenza, Sora 2 genera video e audio insieme, non separatamente. Questo crea un risultato più coerente senza bisogno di mixing audio in post‑produzione.
-
Multi‑shot storyboarding: capacità di seguire istruzioni complesse che coprono più inquadrature mantenendo coerenza di mondo e storia.
App Sora: social network per video AI
OpenAI non ha lanciato solo un modello, ma un ecosistema completo ispirato a TikTok e Instagram Reels.
Funzionalità principali dell’app
|
Funzione
|
Descrizione
|
Utilizzo pratico
|
|
Create
|
Generazione di video da descrizione testuale o immagine |
Creazione di contenuti di base, prototipazione rapida di idee |
|
Remix
|
Modifica di video esistenti di altri utenti |
Creazione collaborativa, iterazione su concetti di successo |
|
Cameos
|
Inserimento della propria immagine nei video generati |
Contenuti personalizzati, trend virali |
|
Feed (For You)
|
Feed personalizzato orientato all’ispirazione creativa |
Scoperta di stili, apprendimento dalla community |
|
Direct Messages
|
Condivisione di video con utenti selezionati |
Collaborazione privata, test prima della pubblicazione |
Cameos: una funzione rivoluzionaria con interrogativi etici
Come funziona Cameos
-
Caricamento una tantum: l’utente carica un breve video e una traccia audio per catturare aspetto e voce
-
Liveness check: OpenAI verifica l’autenticità tramite sfide audio per prevenire abusi deepfake
-
Autorizzazioni granulari: l’utente controlla chi può usare la sua immagine (solo io, amici selezionati, contatti reciproci, tutti)
-
Diritto alla cancellazione: l’utente può eliminare in qualsiasi momento qualsiasi video che lo riguarda, inclusi i concept non pubblicati
-
Personalizzazione: possibilità di modificare come il modello rappresenta l’utente (correzione di “allucinazioni” nei vestiti, accento, ecc.)
Durante i test interni in OpenAI, i dipendenti hanno segnalato che grazie a Cameos hanno conosciuto nuovi colleghi con cui altrimenti non si sarebbero incontrati – si crea una nuova dinamica sociale basata sulla collaborazione creativa.
Principi di sviluppo responsabile secondo Sam Altman
Il CEO di OpenAI, Sam Altman, nel suo blog discute apertamente sia i benefici che i rischi legati a Sora 2.
"Social media has had some good effects on the world, but it's also had some bad ones. We are aware of how addictive a service like this could become, and we can imagine many ways it could be used for bullying."
— Sam Altman, CEO OpenAI
-
Ottimizzazione per la soddisfazione di lungo periodo: dopo 6 mesi la maggior parte degli utenti dovrebbe percepire che la propria vita è migliore grazie a Sora. In caso contrario, OpenAI apporterà cambiamenti significativi o chiuderà il servizio.
-
Controllo del feed: gli utenti possono dire a Sora cosa vogliono vedere – contenuti rilassanti, video energizzanti, interessi specifici, limiti di tempo. Il controllo parentale consente di disattivare la personalizzazione.
-
Priorità alla creazione: focus su rendere la creazione di contenuti semplice e gratificante per tutti. La convinzione che le persone siano creatori naturali e che la creazione sia fondamentale per la soddisfazione di vita.
-
Supporto agli obiettivi di lungo termine: cercare di comprendere i veri obiettivi degli utenti e aiutarli a raggiungerli – da relazioni migliori al fitness fino all’imprenditoria.
Preoccupazioni etiche e mitigazione
-
Rischio di dipendenza: Altman parla apertamente della possibilità di creare un “RL‑optimized slop feed” – un algoritmo che massimizza il tempo trascorso nell’app a scapito della qualità della vita.
-
Prevenzione del bullismo: il team lavora a protezioni contro gli abusi, incluse verifiche regolari dell’impatto su umore e benessere degli utenti.
-
Prevenzione deepfake: protezione contro l’uso dell’immagine di altre persone senza consenso, con limitazioni per le figure pubbliche.
Situazione legale
-
Contenziosi in corso: OpenAI affronta cause da parte di autori tra cui Ta‑Nehisi Coates e Jodi Picoult, giornali come il New York Times e altri titolari di copyright.
-
Precedente: il concorrente Anthropic ha recentemente accettato di pagare 1,5 miliardi di dollari in un accordo con autori che sostenevano un utilizzo illegale dei loro libri per addestrare modelli AI.
-
Incertezza giuridica: la differenza tra l’uso di contenuti protetti come input per l’addestramento e la generazione di output che riproducono contenuti protetti resta legalmente incerta.
"Since Sora 2's release, videos that infringe our members' films, shows, and characters have proliferated on OpenAI's service and across social media."
— Charles Rivkin, CEO Motion Picture Association
OpenAI non tratta con Hollywood
A differenza del concorrente Runway, che ha stretto una partnership con Lionsgate per ottenere piena autorizzazione all’uso dei loro film nell’addestramento dei modelli
AI, OpenAI non ha ancora un accordo simile con i grandi studi. Questo suggerisce che le priorità di OpenAI siano diverse dalla produzione cinematografica professionale.
Confronto con la concorrenza
Il mercato dei generatori video
AI si è ampliato in modo significativo durante il 2025. Come si posiziona Sora 2 rispetto ai concorrenti?
|
Modello
|
Durata max
|
Audio
|
Fisica
|
Vantaggio principale
|
|
Sora 2 (OpenAI)
|
20 secondi |
✓ Sintetico |
Avanzata |
Video più lunghi, fisica best‑in‑class, cameos |
|
Runway Gen‑4
|
10 secondi |
✓ Generato |
Buona |
Strumenti professionali, partnership con Lionsgate |
|
Veo 3 (Google)
|
~10 secondi |
✗ Non ancora |
Buona |
Addestrato su dati YouTube, integrazione con Google |
|
Kling AI
|
5 secondi |
✗ No |
Base |
Generazione rapida, prezzo inferiore |
|
Luma Dream Machine
|
5 secondi |
✗ No |
Media |
Generazione molto rapida (30s) |
Nuova era della creatività o vaso di Pandora?
Sora 2 rappresenta un salto tecnologico significativo nel campo della generazione video
AI.
Video di 20 secondi con qualità professionale, audio sincronizzato e simulazione fisica avanzata sono una realtà accessibile a chiunque abbia accesso all’app.
Sam Altman lo chiama
“momento ChatGPT per la creatività” – analogo al lancio di ChatGPT nel novembre 2022, che ha cambiato il modo in cui le persone si rapportano ai contenuti scritti. Se Sora 2 diventerà un momento simile per il
video, lo dirà il tempo.
Le domande chiave restano aperte
-
Come verranno risolte le dispute sul copyright con gli studi di Hollywood?
-
OpenAI riuscirà davvero a prevenire la creazione di un “slop feed” che crea dipendenza?
-
Quanto rapidamente la tecnologia diventerà accessibile al grande pubblico (oltre l’invite‑only)?
-
Quale sarà la struttura di prezzo dell’API e dell’uso in produzione?
Una cosa è certa:
il confine tra contenuto reale e artificiale si è appena spostato in modo drastico. Che ciò porti a una “Cambrian explosion of creativity”, come prevede Altman, o a un mondo distopico pieno di deepfake e contenuti ottimizzati da algoritmi, dipende dalle decisioni che, come società, prenderemo nei prossimi mesi e anni.