OpenAI przedstawia „Sora”, model sztucznej inteligencji, który przekształca tekst w realistyczne filmy

2024/02/16

OpenAI ogłosiło Sorę – przełomowy model sztucznej inteligencji, który jest w stanie generować realistyczne i pomysłowe filmy na podstawie prostych podpowiedzi tekstowych. Sora może generować filmy o długości do minuty, zgodnie z opisem użytkownika i zachowując jakość wizualną przez cały czas trwania filmu. Post Openai na X jest osadzony tuż poniżej.

Przedstawiamy Sorę, nasz model zamiany tekstu na wideo.

Sora może tworzyć filmy trwające do 60 sekund, zawierające bardzo szczegółowe sceny, złożone ruchy kamery i wiele postaci wywołujących żywe emocje. https://t.co/7j2JN27M3W

Podpowiedź: „Pięknie, śnieżnie… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) 15 lutego 2024 r

Firma twierdzi, że nowy model sztucznej inteligencji doskonale radzi sobie z przedstawianiem złożonych scen z wieloma postaciami, zróżnicowanymi emocjami i skomplikowanymi szczegółami otoczenia. Oprócz dokładnego interpretowania podpowiedzi użytkownika, Sora może również zrozumieć leżącą u podstaw fizykę i dynamikę przestrzenną na podstawie opisów.

Dzięki temu model lepiej ujmuje fizyczne relacje między obiektami i postaciami, aby zapewnić spójność w generowanych filmach.

Pomimo swoich niezwykłych możliwości OpenAI przyznaje, że Sora ma pewne ograniczenia. Na podstawie wygenerowanych filmów i notatek firmy model sztucznej inteligencji może czasami mieć trudności ze skomplikowanymi symulacjami fizycznymi i może nie rozumieć scenariuszy przyczynowo-skutkowych. Może również błędnie zinterpretować szczegóły przestrzenne lub napotkać wyzwania związane z precyzyjnymi opisami opartymi na czasie.

Co więcej, OpenAI priorytetowo traktuje środki bezpieczeństwa, zanim Sora zostanie udostępniona wszystkim. Firma współpracuje z ekspertami od dezinformacji i uprzedzeń, aby rygorystycznie przetestować Sorę pod kątem luk w zabezpieczeniach. OpenAI planuje wdrożyć narzędzia do wykrywania wprowadzających w błąd treści i wprowadzić zabezpieczenia zapobiegające generowaniu za pomocą Sory treści zawierających przemoc, nienawiść lub seksualność oraz podobizny gwiazd.

Obecnie Sora jest dostępna dla „czerwonych członków drużyny”, których zadaniem jest ocena szkód i zagrożeń związanych z modelem. OpenAI twierdzi, że zapewnia także artystom wizualnym, projektantom i filmowcom dostęp do Sory w celu uzyskania opinii.

Oto demonstracje udostępnione przez OpenAI na platformie X.

Podpowiedź: „Wspaniale odwzorowany papierowy świat rafy koralowej, pełen kolorowych ryb i stworzeń morskich”. pic.twitter.com/gzEE8SwP81

— OpenAI (@OpenAI) 15 lutego 2024 r

tutaj jest lepszy: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN

— Sam Altman (@sama) 15 lutego 2024 r

Tempo rozwoju technologii sztucznej inteligencji umożliwiającej przetwarzanie tekstu na wideo przyprawia nas o ślinotok. Co z tobą?

Dodaj komentarz Anuluj pisanie odpowiedzi