Meta の Movie Gen: テキストからビデオとサウンドを作成する AI テクノロジー、ただしアクセシビリティは限定的

Meta の Movie Gen: テキストからビデオとサウンドを作成する AI テクノロジー、ただしアクセシビリティは限定的

重要な洞察

  • Meta は、テキストプロンプトからビデオを生成する Movie Gen という画期的な AI モデルを導入しました。これは、OpenAI の次期 Sora に期待される同様の機能を反映しています。
  • ビデオ作成に加えて、Movie Gen の機能には、写真をビデオ コンテンツに変換したり、クリップにテキストベースの編集を適用したり、ビデオに付随するオーディオを生成したりすることが含まれます。
  • Movie Genは現在開発中であり、一般公開の具体的なスケジュールはまだ発表されていない。

Meta の Movie Gen は、 AI テクノロジーの目覚ましい進歩を示しています。ユーザーは、テキストを入力するだけで、短いビデオ クリップを作成したり、既存のクリップを変更したり、画像をビデオに変換したり、さらにはサウンドを生成したりすることができます。これは、コンテンツ クリエイター向けの包括的なスイートと言えます。

OpenAI の Sora など、他の新興のテキストからビデオへのシステムと同様に、Movie Gen はまだ使用できず、現在のすべてのデモンストレーションは将来の機能に関するものです。基本的なコンセプトは一貫しており、テキストを入力して魅力的な高解像度のビデオを作成します。

さらに、ユーザーはさまざまなアスペクト比でビデオを生成するオプションも利用できます。

Movie Genのもう 1 つの注目すべき点は、ビデオ編集機能です。この機能により、ユーザーは映像をアップロードし、プロンプトを使用して映像を操作し、カスタマイズされた編集を行ったり、スタイルやトランジションを適用したり、AI 駆動機能を使用してクリップを強化したりできます。

Movie Gen の特に印象的な機能は、「パーソナライズされたビデオ」を作成できることです。これは、写真を使用してビデオを生成しながら、個人のアイデンティティと表現を細心の注意を払って保存する機能です。

このモデルには、テキスト プロンプトから派生したものかどうかに関係なく、最大 45 秒間のビデオ用オーディオを生成する機能もあります。このオーディオには、効果音、インストゥルメンタル ミュージック、環境音などを含めることができ、すべてビデオの再生と同期されます。オーディオ拡張アプローチは、オーディオとビデオのコンポーネント間のシームレスな結合を保証するために使用されています。

Meta 社は、このモデルは「創造性を高める可能性がある」と主張しているが、「すぐに製品化される予定はなく、依然としてコストがかかり、生成に時間がかかる」ことを認めている。しかし、結果は非常に顕著であるため、進捗状況をお知らせしたい」としている。AI 動画生成技術はまだ進化しているが、Movie Gen は Meta 社を、独自のテキストから動画へのモデルを模索している OpenAI 社や Google 社と並ぶ競争の激しい分野に位置付けている。

AI によるビデオ生成の急速な進歩は、AI 生成画像で観察されているように、潜在的な悪用に対する懸念を引き起こし、映画製作者やビデオアーティストのキャリアを危険にさらす可能性を高めています。完全に AI で生成された映画が市場に登場するのもそう遠くないかもしれません。とはいえ、この技術はまだ開発中であり、Meta はリリース予定日を公表していませんが、来年末までにデビューする可能性は低いようです。

ソース

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です