OpenAI、テキストをリアルなビデオに変換する AI モデル「Sora」を発表
OpenAI は、単純なテキスト プロンプトから本物そっくりで想像力豊かなビデオを生成できる画期的な AI モデル、Sora を発表しました。 Sora は、ユーザーの説明に従い、ビデオ全体にわたって視覚的な品質を維持しながら、最長 1 分のビデオを生成できます。 X に関する Openai の投稿はすぐ下に埋め込まれています。
テキストからビデオへの変換モデルである Sora を紹介します。
Sora は、非常に詳細なシーン、複雑なカメラの動き、生き生きとした感情を持った複数のキャラクターをフィーチャーした最大 60 秒のビデオを作成できます。https://t.co/7j2JN27M3W
プロンプト: 「美しい、雪… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 2024 年 2 月 15 日
同社によると、新しいAIモデルは、複数の登場人物がいる複雑なシーン、微妙な感情、環境の複雑な詳細を描写することに優れているという。ユーザーのプロンプトを正確に解釈することに加えて、Sora は、説明から基礎となる物理学と空間力学を理解することもできます。
これにより、モデルはオブジェクトとキャラクターの間の物理的な関係をより適切に把握できるようになり、生成されたビデオ内の一貫性が確保されます。
OpenAI は、その驚くべき機能にもかかわらず、Sora にはいくつかの制限があることを認めています。生成されたビデオと同社のメモに基づくと、AI モデルは複雑な物理シミュレーションに苦労する場合があり、因果関係のシナリオを理解できない可能性があります。また、空間的な詳細を誤って解釈したり、正確な時間ベースの説明で困難に直面したりする可能性もあります。
さらに、OpenAI は、Sora を誰もが利用できるようになる前に、安全対策を優先しています。同社は誤った情報や偏見の専門家と協力して、Sora の脆弱性を厳密にテストしています。 OpenAI は、誤解を招くコンテンツを検出するツールを実装し、Sora を使用して暴力的、憎悪的、または性的なコンテンツや有名人の肖像が生成されるのを防ぐための安全策を導入する予定です。
現時点では、Sora は、モデルの害やリスクを評価するよう割り当てられた「レッド チーム担当者」が利用できます。 OpenAI は、ビジュアル アーティスト、デザイナー、映画製作者がフィードバックを得るために Sora にアクセスできるようにすると述べています。
以下は OpenAI が X 上で共有したデモンストレーションです。
プロンプト: 「色とりどりの魚や海洋生物があふれるサンゴ礁を、豪華に表現されたペーパークラフトの世界。」 pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) 2024 年 2 月 15 日
これはより良いものです: https://t.co/WJQCMEH9QG pic.twitter.com/oymtmHVmZN
— サム・アルトマン (@sama) 2024 年 2 月 15 日
テキストからビデオに変換する AI 技術の進化の速さには、よだれが出るほどです。あなたはどうですか?
コメントを残す