Sora AI lance de nouvelles vidéos de démonstration, tout aussi étonnantes
Récemment, nous vous avons parlé d’un nouvel outil de conversion texte-vidéo appelé Sora AI et des raisons pour lesquelles il va changer l’industrie de la publicité et de la vidéo dans son ensemble.
Bien qu’il soit encore en phase de test, Open AI a publié de nombreuses autres vidéos de démonstration tout aussi étonnantes, montrant les nouvelles capacités LLM.
Les nouveaux clips Sora AI sont à couper le souffle
Dans le clip ci-dessus, vous ne verrez que quelques exemples collés par AI-nstein, mais il y en a beaucoup plus sur la page Web Sora d’Open AI que vous pouvez parcourir et regarder.
Il est assez difficile de parler de tous, mais comme vous pouvez le voir, le robot IA a réussi à recréer l’image du globe terrestre dans l’œil d’un personnage virtuel et il a dessiné un extraterrestre très réaliste errant à travers New York comme il y appartenait.
Mais ce n’est pas tout. Sora AI peut combiner des chartes de dessins animés et les mélanger dans des représentations réalistes et représenter des animaux virtuels jouant et agissant.
Le robot texte-vidéo présente encore des faiblesses. Certains, comme décrit par l’équipe Open AI, sont la difficulté d’obtenir les bons détails spatiaux, de mélanger les directions et de suivre le chemin de la caméra :
Comme il y a beaucoup de bruit aujourd’hui sur la légitimité du contenu généré par l’IA, l’équipe Sora AI souhaite inclure des métadonnées C2PA dans les clips pour éviter d’induire en erreur ces vidéos avec des images réelles, ou pour éviter toute invite inappropriée :
En plus de cela, les nouveaux clips de démonstration de Sora AI sont incroyables et montrent un avenir prometteur pour le contenu généré par vidéo. Cependant, cela pourrait être une mauvaise nouvelle si vous travaillez dans l’industrie cinématographique.
Que pensez-vous de Sora AI ? Partagez vos pensées dans la section des commentaires ci-dessous.
Une fois dans un produit OpenAI, notre classificateur de texte vérifiera et rejettera les invites de saisie de texte qui enfreignent nos politiques d’utilisation, comme celles qui demandent une violence extrême, du contenu sexuel, des images haineuses, une ressemblance avec une célébrité ou l’adresse IP d’autrui. Nous avons également développé des classificateurs d’images robustes qui sont utilisés pour examiner les images de chaque vidéo générée afin de garantir qu’elle respecte nos politiques d’utilisation, avant qu’elle ne soit présentée à l’utilisateur.
IA ouverte
Le modèle peut également confondre les détails spatiaux d’une invite, par exemple en mélangeant la gauche et la droite, et peut avoir du mal à décrire avec précision les événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.
IA ouverte
Laisser un commentaire