Windows 11 バージョン 24H2 で確認された AI 機能
- Microsoft は、Windows 11 24H2 でさまざまな新しいオンデバイス AI 機能を導入する予定です。
- 注目の機能には、Windows リコール、Windows Studio エフェクト、ライブ キャプション、自動スーパー解像度、音声明瞭度、音声フォーカス、クリックして実行、ペイント アプリの Cocreator、フォト アプリのイメージのスタイル変更などがあります。
- さらに、Copilot for Windows 11 にも機能強化が行われます。
10 月 1 日から、Windows 11 24H2 (2024 Update) が対象デバイス向けに展開されていますが、当初は期待されていた AI 機能が欠けています。Microsoft は、これらの機能が完全に展開できるように時間をかけて準備しています。とはいえ、Windows Copilot Runtime の統合から始まる初期の AI 機能の詳細は明らかにされています。
この改良版の OS では、Windows Recall、Windows Studio エフェクト、ライブ キャプション (リアルタイム翻訳を含む)、自動スーパー解像度、音声明瞭度、Click to Do、音声フォーカス、ペイント アプリの Cocreator、フォト アプリ内の画像の再スタイルなど、Copilot+ PC 向けに設計された独自の AI 機能がいくつか導入されます。
これらのイノベーションは、デバイス上で直接動作する 40 を超える AI モデルを統合し、それらの機能に必要なインフラストラクチャを提供するシステム コンポーネントである新しい「Windows Copilot Runtime」から生まれました。
これにより、開発者はWindows Copilot ライブラリで利用可能な新しい API を通じて、アプリケーションに AI 機能を組み込むことも容易になります。
Windows 11 バージョン 24H2 の AI 機能
2024 年以降に Windows に導入されると予想される AI 機能の概要を以下に示します。
Windows リコール
Windows Recall は、バックグラウンドの写真メモリとして機能し、コンピューター上のアクティビティのスナップショットを自動的にキャプチャします。この機能は、ローカルで実行される複数の AI モデルを利用して、テキストや画像など、すべてのコンテンツを自然言語で検索できるようにします。
この革新的なリコール機能は、NPU 対応プロセッサ、16 GB の RAM、256 GB の SSD ストレージなどの互換性のあるハードウェアを搭載した Copilot+ PC でのみ利用できます。
最初の OOBE (Out-Of-Box Experience) 中に、ユーザーはこの機能を有効または無効にすることができ、設定アプリまたはグループ ポリシーを通じて追加の制御も利用できます。
Windows Studio エフェクト
Windows Studio Effects には、AI を活用してニューラル プロセッシング ユニット (NPU) を通じてビデオ通話とオーディオの品質を向上させる一連の機能が含まれています。
現在、自動フレーミング、背景ぼかし、アイコンタクト、音声フォーカス、クリエイティブ フィルターの 5 つの主なエフェクトがあります。
- 自動フレーミング:移動中でもカメラビューの中央に留まります。
- 背景ぼかし:ビデオ通話中に背景をぼかしてプライバシーを強化したり、雑然としたものを隠したりできます。「標準ぼかし」と「ポートレートぼかし」の両方の機能があります。
- アイコンタクト:アイコンタクトが認識されるように外観を調整します。「標準」モードと「テレプロンプター」モードが利用できます。
- 音声フォーカス:通話中にバックグラウンド ノイズを最小限に抑えて音声をクリアにします。NPU を使用するタイプとソフトウェアのみを使用するタイプの 2 種類があります。
Studio Effects は Windows 11 に以前から存在していましたが、Microsoft はバージョン 24H2 で特に Copilot+ PC 向けにその利用可能範囲を広げる予定です。
翻訳機能付きライブキャプション
Windows 11 に搭載されているライブ キャプション機能がアップグレードされ、ライブ翻訳が追加されます。このツールは、自動文字起こしによって、特に聴覚障害のある人など、すべての人がオーディオ コンテンツを理解できるように設計されています。
アップグレードされた機能は、YouTube や他のプラットフォームなど、ソースに関係なく、ビデオ通話や音声通話の音声をリアルタイムで母国語に翻訳します。NPU でサポートされている限り、インターネット接続を必要とせずに 40 以上の言語を英語に翻訳できます。
この機能は、単純な文字起こしからリアルタイムの音声翻訳に移行していることに注意することが重要です。
音声の明瞭度
Voice Clarity 機能は AI を使用して、ビデオ通話や音声通話、およびオーディオ録音中にバックグラウンド ノイズを除去し、エコーをキャンセルし、残響を軽減します。
この機能は、よりクリアなコミュニケーションを提供することで、オンライン ゲームにも役立ちます。アプリケーションでは、最適なオーディオ品質を得るために「ディープ ノイズ抑制」を有効にすることができます。Voice Clarity は、NPU を搭載した互換性のあるハードウェアを搭載したサポートされているアプリで自動的に動作し、手動でアクティブ化する必要はありません。
クリックして実行
Android の「Circle to Search」や Chrome の「Google Lens」に慣れているなら、「Click to Do」も似たような感じがするでしょう。これは AI を利用して画面のコンテンツを認識、解釈し、さまざまな実行可能なタスクを提供します。
これを使用するには、「Windows」キーを押したまま画面をクリックすると、さまざまなアクション オプションを示すオーバーレイ メニューが開きます。また、上部には Windows Recall と統合された検索ボックスがあります。
強化された Windows 検索
正式にはそう呼ばれていませんが、Windows 検索機能は AI 機能で刷新されます。この機能強化により、ユーザーはキーワードに頼るのではなく、ファイル エクスプローラー、設定アプリ、タスク バーで直接、アプリ、ファイル、設定の自然言語検索を実行できるようになります。
自動スーパー解像度
自動超解像度 (SR) は、AI 技術を利用してゲームの解像度と画質を向上させ、フレーム レートを最大化しながら、よりスムーズで効率的なゲームプレイ体験を実現します。基本的に、AI を使用してゲームをアップスケールし、グラフィックスとパフォーマンスを向上させます。
この機能は、Nvidia の DLSS、AMD の FidelityFX Super Resolution (FSR)、Intel の Xe Super Sampling (XeSS) と類似しており、いずれも AI を活用してゲームのビジュアルを強化します。
この取り組みの一環として、 Microsoft はNvidia、AMD、Intel と共同で「DirectSR」API を開発し、将来のゲーム タイトルに SR を組み込むことを目指しています。
ただし、この機能は最新の Qualcomm Snapdragon X Elite プロセッサを搭載した Copilot+ PC のみに対応し、一部のゲームに限定されます。
ペイントの共同作成者と生成的な塗りつぶしと消去
Microsoft は、ペイント アプリに、AI 画像を生成する代わりに描画をスキャンする新しいCocreator機能を導入します。この機能は、芸術的なコンセプトの洗練、編集、開発に役立ちます。
この機能は、拡散ベースのアルゴリズムを採用して、最小限の労力で高品質の画像を生成し、作成内容をより文字通りにするか、より表現豊かにするかをカスタマイズするための設定を提供します。
Cocreator は Copilot+ PC 専用であり、クラウド リソースを利用してテキスト プロンプトをビジュアルに変換する AI 機能である「Image Creator」と混同しないように注意することが重要です。
ジェネレーティブフィル
ペイントの「塗りつぶし」機能を使用すると、ユーザーは画像の特定の領域を選択し、テキスト プロンプトに基づいてそのセクションを強調する新しい要素を生成できます。この機能は、まず最新の Qualcomm プロセッサを搭載した Copilot+ PC で利用できるようになります。
生成消去
ペイント アプリケーションには「消去」機能も導入され、モバイル デバイスで利用できる機能と同様に、ユーザーは AI を使用して画像の一部を選択して削除できるようになります。
この機能は、AI サポートがないデバイスも含め、すべてのデバイスに展開される予定です。
写真のスタイル変更、画像作成、超解像度
写真アプリには、高度な画像生成および編集技術を活用し、AI とデバイスの NPU を通じて写真のスタイルを変更することを目的とした新しい「画像の再スタイル」機能が組み込まれます。
この機能により、ユーザーは画像を選択してスタイルを変換できます。モバイル アプリでフィルターを適用するのとよく似ています。ユーザーはテキスト プロンプトを入力して新しい背景を作成することもできます。
画像クリエーター
フォト アプリケーションには、ペイントと同じ「イメージ クリエーター」ツールが搭載され、ユーザーは簡単なテキスト プロンプトに基づいて AI 生成画像を作成できます。ペイント バージョンとは異なり、この機能は DALL-E 言語モデルを使用してクラウドで動作するため、Copilot+ PC 専用ではありません。
超解像度
スーパー解像度機能により、ユーザーは AI を通じて画像を拡大することができます。これは Copilot+ PC でのみ利用可能です。NPU を利用して、元の解像度の最大 8 倍まで画像を強化し、鮮明化します。
Microsoft はまた、フォトのスーパー解像度機能により、古くて低品質の画像を元の状態に戻すことができると約束しています。
Windows 11 向け Copilot のアップデート
Copilot は以前から Windows 11 の機能でしたが、バージョン 24H2 では更新が導入されます。このアプリは、タスクバーにピン留めしたり削除したりできる標準アプリケーションとして機能し、ユーザーは他のアプリと同様にサイズを変更したり移動したりできます (Windows 11 23H2 でも利用できます)。
このアプリケーションは、実際には Windows 11 に Web アプリとしてインストールされる Web バージョンです。基本的な機能は同じままですが、システム設定を変更することはできなくなります。さらに、インターフェイスは OpenAI ChatGPT Web エクスペリエンスに似せて更新されました。
さらに、Copilot は設定アプリに統合されます。チャットボットを呼び出すための明示的なボタンの代わりに、設定内に「Copilot の提案」が表示されます。たとえば、システム セクションでは、オーディオの問題の解決、省エネ設定の有効化、ワイヤレス ディスプレイへのストリーミングに関する役立つ提案が表示されます。
ファイル エクスプローラーでは、Microsoft は Copilot の支援によりユーザー タスクを効率化することを目指しており、画像の上にマウスを移動して Copilot ボタンをクリックすると、画像に適用可能なアクションを実行できます。
さらに、Copilot は通知機能の一部にもなります。トースト通知を受信すると、特定のシナリオに関連する提案が表示されます。たとえば、電子メールに PowerPoint の添付ファイルが含まれている場合、Copilot はその内容を要約することを推奨する場合があります。
この統合により、ユーザーはさまざまなタスクの実行中に Copilot と画面を共有して支援を受けることができます。
開発者もアプリケーションに AI 機能を組み込み始めるでしょう。これは、将来のオペレーティング システムのアップデートで AI 機能がより幅広く統合されることを示しています。
Copilot の最近の変更は、最近の Surface 発売イベントで初めて紹介されましたが、それ以降、Copilot の提案に関する詳細はまだ明らかにされていません。
結論
Windows 11 の 2024 アップデートは現在利用可能で、新機能や強化機能が満載ですが、AI 機能はまだ含まれていません。Microsoft は、セキュリティ機能が強化された Windows Recall を含むこれらの AI 機能を、10 月中に Windows Insider Program を通じて Copilot+ PC でテスト開始し、2024 年 11 月にさらに広範囲に展開する予定です。
Copilot+ PC は、AI アプリケーション向けに設計された新しいカテゴリのスマート コンピューターです。最初のラインナップには、Qualcomm Snapdragon X シリーズ プロセッサと統合 NPU が搭載されており、広範な AI 機能をサポートしながら終日のバッテリー性能を確保します。これらのマシンには、少なくとも 16 GB の RAM と 256 GB のストレージが搭載されています。Intelと AMD の新しい製品にも、これらの高度な AI エクスペリエンスを促進する NPU を備えたプロセッサが含まれる予定です。
2024 年 10 月 8 日更新:この記事は、正確で最新のコンテンツを提供するために改訂されました。
コメントを残す