OpenAI przedstawia „Sora”, model sztucznej inteligencji, który przekształca tekst w realistyczne filmy
OpenAI ogłosiło Sorę – przełomowy model sztucznej inteligencji, który jest w stanie generować realistyczne i pomysłowe filmy na podstawie prostych podpowiedzi tekstowych. Sora może generować filmy o długości do minuty, zgodnie z opisem użytkownika i zachowując jakość wizualną przez cały czas trwania filmu. Post Openai na X jest osadzony tuż poniżej.
Przedstawiamy Sorę, nasz model zamiany tekstu na wideo.
Sora może tworzyć filmy trwające do 60 sekund, zawierające bardzo szczegółowe sceny, złożone ruchy kamery i wiele postaci wywołujących żywe emocje. https://t.co/7j2JN27M3W
Podpowiedź: „Pięknie, śnieżnie… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 15 lutego 2024 r
Firma twierdzi, że nowy model sztucznej inteligencji doskonale radzi sobie z przedstawianiem złożonych scen z wieloma postaciami, zróżnicowanymi emocjami i skomplikowanymi szczegółami otoczenia. Oprócz dokładnego interpretowania podpowiedzi użytkownika, Sora może również zrozumieć leżącą u podstaw fizykę i dynamikę przestrzenną na podstawie opisów.
Dzięki temu model lepiej ujmuje fizyczne relacje między obiektami i postaciami, aby zapewnić spójność w generowanych filmach.
Pomimo swoich niezwykłych możliwości OpenAI przyznaje, że Sora ma pewne ograniczenia. Na podstawie wygenerowanych filmów i notatek firmy model sztucznej inteligencji może czasami mieć trudności ze skomplikowanymi symulacjami fizycznymi i może nie rozumieć scenariuszy przyczynowo-skutkowych. Może również błędnie zinterpretować szczegóły przestrzenne lub napotkać wyzwania związane z precyzyjnymi opisami opartymi na czasie.
Co więcej, OpenAI priorytetowo traktuje środki bezpieczeństwa, zanim Sora zostanie udostępniona wszystkim. Firma współpracuje z ekspertami od dezinformacji i uprzedzeń, aby rygorystycznie przetestować Sorę pod kątem luk w zabezpieczeniach. OpenAI planuje wdrożyć narzędzia do wykrywania wprowadzających w błąd treści i wprowadzić zabezpieczenia zapobiegające generowaniu za pomocą Sory treści zawierających przemoc, nienawiść lub seksualność oraz podobizny gwiazd.
Obecnie Sora jest dostępna dla „czerwonych członków drużyny”, których zadaniem jest ocena szkód i zagrożeń związanych z modelem. OpenAI twierdzi, że zapewnia także artystom wizualnym, projektantom i filmowcom dostęp do Sory w celu uzyskania opinii.
Oto demonstracje udostępnione przez OpenAI na platformie X.
Podpowiedź: „Wspaniale odwzorowany papierowy świat rafy koralowej, pełen kolorowych ryb i stworzeń morskich”. pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) 15 lutego 2024 r
tutaj jest lepszy: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
— Sam Altman (@sama) 15 lutego 2024 r
Tempo rozwoju technologii sztucznej inteligencji umożliwiającej przetwarzanie tekstu na wideo przyprawia nas o ślinotok. Co z tobą?
Dodaj komentarz