微軟的新專利揭曉了 Copilot,用於創作音樂以配合視訊和 PowerPoint 簡報

微軟的新專利揭曉了 Copilot,用於創作音樂以配合視訊和 PowerPoint 簡報

總部位於雷德蒙的科技巨頭微軟最近開始更新其 Copilot 工具,採用時尚的新介面來增強使用者體驗。然而,該公司為這款由人工智慧驅動的助理制定了更雄心勃勃的計劃。

在一項新發布的專利中,微軟公佈了其開發的用於創作音訊樂譜的人工智慧模型。這項創新技術旨在創造與各種形式的媒體相匹配的音樂或聲音,包括影片、文字、PowerPoint 簡報、虛擬現實,甚至目前處於製作階段的視訊遊戲。

專利的標題很有趣:「用於創作音訊樂譜的人工智慧模型」,探索了這種先進的 Copilot 工俱生成音樂的方法。

最初,該過程涉及從包含視覺和音訊元素的各種視聽資料集中累積大量訓練資料。

副駕駛音樂創作

這些資料集經過徹底分析以提取各種特徵。這包括檢查影片的視覺特徵,例如顏色、形狀、運動和場景。此外,影片中出現的任何文字元素(例如字幕或螢幕文字)也會被收集。該工具還將分析視訊本身中現有的音訊特徵,將其與樂譜區分開來。

提取數據後,Copilot 將評估這些特徵以建立相關性。例如,它可能會識別出某些場景(例如日落)通常與特定類型的音樂相對應,例如平靜的旋律。

透過這些功能的訓練,人工智慧模型將利用其關聯係統來產生與新視訊內容的視覺和文字屬性相匹配的合適的音訊分數。

這項突破性的技術開啟了許多潛在的應用,包括:

  • 電影和影片製作:自動為長片、電視劇或線上影片內容製作背景配樂。
  • 行銷:創作與廣告的基調和訊息完美匹配的音樂。
  • 遊戲:創造可響應遊戲視覺效果和玩家動作而變化的自適應音軌。
  • 虛擬實境:透過隨視覺環境變化的音訊增強沉浸式體驗。

憑藉其生成音樂的能力,Copilot 可以顯著減少音訊製作所需的時間,透過自動化創作音訊樂譜的過程,確保配樂與視覺內容無縫補充。

值得注意的是,AI 模型目前透過今年稍早推出的 SUNO 插件提供了基本的音樂創作功能。

儘管如此,對該插件的增強將是有益的,它允許創意人員在將音樂作品呈現給專業音樂作曲家之前建立他們的音樂作品願景。

雖然對可能取代人類作曲家的擔憂是有道理的,但從長遠來看,授權 Copilot 創作音樂將主要提高生產力。您對這項創新發展有何看法?

您可以在此處閱讀該專利

來源

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *