Microsoft의 새로운 특허, 비디오 및 PowerPoint 프레젠테이션에 음악을 추가하는 Copilot 공개
레드먼드에 본사를 둔 기술 강자인 Microsoft는 최근 사용자 경험을 향상시키는 세련되고 새로운 인터페이스로 Copilot 도구를 업데이트하기 시작했습니다. 그러나 이 회사는 이 AI 기반 어시스턴트에 대해 훨씬 더 야심 찬 계획을 세웠습니다.
새로 공개된 특허에서 Microsoft는 오디오 악보를 작곡하기 위한 인공 지능 모델 개발을 공개했습니다 . 이 혁신적인 기술은 비디오, 텍스트, PowerPoint 프레젠테이션, 가상 현실, 심지어 현재 제작 단계에 있는 비디오 게임을 포함한 다양한 형태의 미디어와 일치하는 음악이나 사운드를 만드는 것을 목표로 합니다.
“오디오 악보 작곡을 위한 인공지능 모델” 이라는 흥미로운 제목이 붙은 이 특허는 이 고급 Copilot 도구가 음악을 생성하는 방법을 탐구합니다.
처음에는 이 과정에 시각적 요소와 청각적 요소를 모두 포함하는 다양한 범위의 시청각 데이터세트로부터 상당한 양의 훈련 데이터를 축적하는 것이 포함됩니다.
이러한 데이터 세트는 다양한 특징을 추출하기 위해 철저한 분석을 거칩니다. 여기에는 색상, 모양, 움직임, 장면과 같은 비디오의 시각적 특성을 조사하는 것이 포함됩니다. 또한 자막이나 화면 텍스트와 같이 비디오에 있는 모든 텍스트 요소도 수집됩니다. 이 도구는 또한 비디오 자체 내의 기존 오디오 특징을 분석하여 악보와 구별합니다.
데이터가 추출되면 Copilot은 이러한 기능을 평가하여 상관 관계를 확립합니다. 예를 들어, 일몰과 같은 특정 장면이 일반적으로 차분한 멜로디와 같은 특정 유형의 음악과 일치한다는 것을 식별할 수 있습니다.
AI 모델은 이러한 기능에 대한 훈련을 통해 상관관계 시스템을 활용하여 새로운 비디오 콘텐츠의 시각적, 텍스트적 속성에 맞는 적절한 오디오 점수를 생성합니다.
이 획기적인 기술은 다음을 포함한 수많은 잠재적인 응용 분야를 열어줍니다.
- 영화 및 비디오 제작 : 장편 영화, TV 시리즈 또는 온라인 비디오 콘텐츠를 위한 배경 음악을 자동으로 제작합니다.
- 마케팅 : 광고의 톤과 메시지에 완벽하게 어울리는 음악을 작곡합니다.
- 게임 : 게임 비주얼과 플레이어 액션에 따라 변화하는 적응형 사운드트랙을 만듭니다.
- 가상 현실 : 시각적 환경과 함께 진화하는 오디오를 통해 몰입형 경험을 강화합니다.
Copilot은 음악을 생성하는 기능을 통해 오디오 제작에 필요한 시간을 크게 줄이고, 오디오 스코어 작곡 과정을 자동화하여 사운드트랙이 시각적 콘텐츠를 원활하게 보완하도록 했습니다.
AI 모델은 올해 초 출시된 SUNO 플러그인을 통해 기본적인 음악 작곡 기능을 제공한다는 점에 주목하는 것이 중요합니다.
그럼에도 불구하고, 해당 플러그인을 향상시키면 창작자들이 전문 음악 작곡가에게 음악 작품을 제시하기 전에 음악 작품에 대한 비전을 확립할 수 있어 유익할 것입니다.
인간 작곡가를 대체할 가능성에 대한 우려는 타당하지만, Copilot이 음악을 작곡할 수 있도록 하는 것은 주로 장기적으로 생산성을 향상시킬 것입니다. 이 혁신적인 개발에 대한 생각은 어떻습니까?
여기에서 특허를 읽어보실 수 있습니다 .
답글 남기기