Nowy patent Microsoftu ujawnia Copilot do tworzenia muzyki towarzyszącej filmom i prezentacjom PowerPoint

Nowy patent Microsoftu ujawnia Copilot do tworzenia muzyki towarzyszącej filmom i prezentacjom PowerPoint

Microsoft, potęga technologiczna z siedzibą w Redmond, niedawno rozpoczęła aktualizację swojego narzędzia Copilot, dodając elegancki, nowy interfejs, który poprawia wrażenia użytkownika. Jednak firma ma jeszcze ambitniejsze plany dla tego asystenta opartego na sztucznej inteligencji.

W niedawno opublikowanym patencie Microsoft ujawnia swój rozwój modelu sztucznej inteligencji do komponowania partytur audio . Ta innowacyjna technologia ma na celu tworzenie muzyki lub dźwięku, który pasuje do różnych form mediów, w tym filmów, tekstu, prezentacji PowerPoint, rzeczywistości wirtualnej, a nawet gier wideo, które są obecnie w fazie produkcji.

Patent o intrygującym tytule „Model sztucznej inteligencji do komponowania partytur audio” bada metody, za pomocą których to zaawansowane narzędzie Copilot będzie generować muzykę.

Początkowo proces ten obejmuje gromadzenie obszernej ilości danych szkoleniowych pochodzących z różnych zestawów danych audiowizualnych, obejmujących zarówno elementy wizualne, jak i dźwiękowe.

Kompozycja muzyczna drugiego pilota

Te zestawy danych przechodzą dokładną analizę w celu wyodrębnienia różnych cech. Obejmuje to badanie cech wizualnych wideo, takich jak kolory, kształty, ruchy i sceny. Ponadto gromadzone są również wszelkie elementy tekstowe obecne w wideo, takie jak napisy lub tekst na ekranie. Narzędzie przeanalizuje również istniejące cechy audio w samym wideo, odróżniając je od partytury muzycznej.

Po wyodrębnieniu danych Copilot oceni te cechy, aby ustalić korelacje. Na przykład może zidentyfikować, że pewne sceny — takie jak zachód słońca — zwykle odpowiadają określonym typom muzyki, takim jak uspokajające melodie.

Po przeszkoleniu tych funkcji model sztucznej inteligencji wykorzysta swój system korelacji do wygenerowania odpowiednich wyników audio, które będą zgodne z atrybutami wizualnymi i tekstowymi nowej treści wideo.

Ta przełomowa technologia otwiera wiele potencjalnych zastosowań, w tym:

  • Produkcja filmów i wideo : automatyczne tworzenie podkładów muzycznych do filmów fabularnych, seriali telewizyjnych lub treści wideo online.
  • Marketing : Komponowanie muzyki, która idealnie pasuje do tonu i przekazu reklamy.
  • Gry : Tworzenie adaptacyjnych ścieżek dźwiękowych, które zmieniają się w reakcji na grafikę gry i działania gracza.
  • Rzeczywistość wirtualna : Wzbogacanie wrażeń immersyjnych za pomocą dźwięku, który ewoluuje wraz ze środowiskiem wizualnym.

Dzięki możliwości generowania muzyki Copilot może znacznie skrócić czas potrzebny na produkcję dźwięku, zapewniając płynne uzupełnianie się ścieżki dźwiękowej z treścią wizualną poprzez automatyzację procesu komponowania ścieżek dźwiękowych.

Warto zauważyć, że model sztucznej inteligencji oferuje obecnie podstawowe możliwości komponowania muzyki za pośrednictwem wtyczki SUNO, która została uruchomiona na początku tego roku.

Niemniej jednak udoskonalenie tej wtyczki byłoby korzystne, pozwalając twórcom na wypracowanie własnej wizji kompozycji muzycznych przed przedstawieniem jej profesjonalnemu kompozytorowi.

Choć obawy dotyczące potencjalnego zastąpienia ludzkich kompozytorów są uzasadnione, umożliwienie Copilotowi komponowania muzyki przede wszystkim zwiększyłoby produktywność w dłuższej perspektywie. Co sądzisz o tym innowacyjnym rozwoju?

Patent można przeczytać tutaj .

Źródło

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *