OpenAI dévoile « Sora », un modèle d’IA qui transforme le texte en vidéos réalistes

2024/02/16

OpenAI a annoncé Sora, un modèle d’IA révolutionnaire capable de générer des vidéos réalistes et imaginatives à partir de simples invites textuelles. Sora peut générer des vidéos d’une durée maximale d’une minute, en adhérant à la description de l’utilisateur et en conservant la qualité visuelle tout au long de la vidéo. Le message d’Openai sur X est intégré juste en dessous.

Présentation de Sora, notre modèle texte-vidéo.

Sora peut créer des vidéos d’une durée maximale de 60 secondes présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes. https://t.co/7j2JN27M3W

Invite : « Magnifique, enneigé… pic.twitter.com/ruTEWn87vf

– OpenAI (@OpenAI) 15 février 2024

La société affirme que le nouveau modèle d’IA excelle dans la représentation de scènes complexes avec plusieurs personnages, des émotions nuancées et des détails complexes de l’environnement. En plus d’interpréter avec précision les invites de l’utilisateur, Sora peut également comprendre la physique sous-jacente et la dynamique spatiale à partir des descriptions.

Cela permet au modèle de mieux saisir les relations physiques entre les objets et les personnages afin d’assurer la cohérence au sein des vidéos générées.

Malgré ses capacités remarquables, OpenAI reconnaît que Sora présente certaines limites. Sur la base des vidéos générées et des notes de l’entreprise, le modèle d’IA peut parfois avoir des difficultés avec des simulations physiques complexes et ne pas comprendre les scénarios de cause à effet. Il peut également mal interpréter les détails spatiaux ou rencontrer des difficultés avec des descriptions précises et temporelles.

De plus, OpenAI donne la priorité aux mesures de sécurité avant que Sora ne soit mis à la disposition de tous. La société collabore avec des experts en désinformation et en préjugés pour tester rigoureusement les vulnérabilités de Sora. OpenAI prévoit de mettre en œuvre des outils pour détecter les contenus trompeurs et de mettre en place des garanties pour empêcher la génération de contenus violents, haineux ou sexuels et de ressemblances avec des célébrités à l’aide de Sora.

Désormais, Sora est à la disposition des « équipes rouges » chargées d’évaluer les dommages ou les risques du modèle. OpenAI déclare qu’il accorde également aux artistes visuels, aux designers et aux cinéastes l’accès à Sora pour obtenir des commentaires.

Voici une démonstration qu’OpenAI a partagée sur X.

Invite : « Un monde en papier magnifiquement rendu représentant un récif de corail, regorgeant de poissons colorés et de créatures marines. » pic.twitter.com/gzEE8SwP81

– OpenAI (@OpenAI) 15 février 2024

en voici un meilleur : https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN

– Sam Altman (@sama) 15 février 2024

Le rythme auquel évolue la technologie de l’IA texte-vidéo nous fait saliver. Et toi?

Laisser un commentaire Annuler la réponse