高度な音声モードで ChatGPT にライブビデオをストリーミングする: ステップバイステップガイド

2024/12/13

重要な洞察

ChatGPT のアップグレードされた高度な音声モードでは、周囲の環境を認識して解釈できるようになりました。
左下隅にあるビデオアイコンを選択して、高度な音声モードでビデオ機能を有効にします。
この機能は現在、ChatGPT のモバイルアプリケーションを通じて Plus および Pro 加入者が利用できます。無料ユーザー向けにいつリリースされるかについては最新情報はありません。

ChatGPT の高度な音声モードが強化され、「視覚」機能が追加され、デバイスのカメラを通じて周囲の状況を認識および理解できるようになりました。この革新的な機能により、ChatGPT はユーザーの視点からのリアルタイムのビデオフィードを受信し、即座に分析できるようになります。

このマルチモーダル機能は、OpenAI による Advanced Voice Mode のリリース時に約 7 か月前に初めて公開されました。以下は、ライブビデオを ChatGPT AVM にストリーミングし、リアルタイムの音声およびビデオ通信を可能にする手順です。

ChatGPT の高度な音声モードでリアルタイムのビデオ通信を行う方法

高度な音声モードの最新のビデオ機能を使用すると、画像やスクリーンショットを撮る必要がなくなります。代わりに、アプリ内でカメラを直接オンにして、フレーム内にキャプチャされている内容を ChatGPT に問い合わせることができます。

ステップ 1:モバイルデバイスの ChatGPT アプリケーションで高度な音声モードを開きます。

ステップ 2:高度な音声モードが開始されると、左下隅に特徴的なビデオアイコンが表示されます。それをクリックすると、ライブビデオストリーミングが開始されます。

ステップ 3:アプリがスマートフォンのカメラにアクセスできるようにします。

ステップ 4:表示したい被写体をカメラのフレーム内に配置し、それについて ChatGPT に問い合わせるだけです。

ステップ 5: ChatGPT は直接受信した視覚情報に基づいてクエリに応答します。ハンズフリーの利便性で対話を継続できます。

ステップ 6:薄暗い場所にいる場合は、フレームの左下にあるフラッシュアイコンをタップして、被写体を明るくします。フレームの右下にあるカメラ切り替えアイコンを使用して、前面カメラと背面カメラを切り替えます。

ステップ 8:ビデオ共有を停止するには、ビデオアイコンをもう一度押すだけで、音声のみの会話に戻ります。

ステップ 9:以前と同様に、音声モードを終了すると、会話のトランスクリプトが届きます。

OpenAI は、12 Days of OpenAI イベントの 6 日目に Advanced Voice Mode の視覚機能を発表しました。このイベントは、テキストからビデオを生成する Sora などの多数のアップデートと新しいツールのおかげで、大成功を収めています。AI テクノロジーのさらなる発展に注目してください。

重要な洞察

ChatGPT の高度な音声モードでリアルタイムのビデオ通信を行う方法

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル