Microsoft の新機能により、Windows 11 で AI モデルをローカルに簡単に実行できます

2024/12/26

Copilot+ PC は、Small Language Models (SLM) をデバイス上で直接実行できる初のコンピューターとして画期的な進歩を遂げています。この革新的なテクノロジーは、クラウドベースの Copilot アプリケーションと比較して、画像やテキストの生成など、さまざまなタスクでより高速な結果をもたらすという大きな利点があります。最近、Microsoft は AI Dev Gallery を発表しました。これにより、デバイス上の AI 機能をあらゆるアプリケーションに簡単に統合できるようになります。

AI Dev Gallery は、さまざまなモデルをテストして AI 機能でアプリケーションを強化することに関心のある開発者向けに特別に設計されています。このツールでは、デバイスで簡単に実行できる 25 を超えるダウンロード可能なサンプルにアクセスできます。さらに、ユーザーはプロジェクトまたはソースコードをアプリケーションに直接エクスポートして、すぐに機能させることができます。Windows 10 と 11 の両方と互換性があり、x64 と ARM64 アーキテクチャをサポートしています。

興味深い実験として、Windows Latest は GitHub リポジトリから AI Dev Gallery を複製しました。現在、これにアクセスするには、実行前に Visual Studio でプロジェクトをビルドする必要があります。さらに、最低 20 GB のストレージとマルチコア CPU が必要です。8 GB の VRAM を備えた GPU が推奨されますが、これはより要求の厳しいモデルにのみ必須です。

私たちは、4 コア CPU と 4 GB の RAM を搭載した Windows 11 PC でテストを開始しました。アプリには、サンプルとモデルの 2 つの動作モードがあります。サンプルモードを使用して、テキスト、画像、コード、オーディオとビデオ、スマートコントロールなどのカテゴリに分類された、利用可能なさまざまなモデルを調べました。

モデルの評価

画像とビデオの生成に使用できるモデルは比較的大きく、サイズは 5 GB 近くあります。当初の選択は、アップスケーリングに重点を置いた 100 MB 未満の小さなモデルでした。スクリーンショットを撮り、CPU を使用して処理することでアップスケーリングを試みました。特に、リクエストの処理に CPU と GPU を切り替えるオプションが利用できます。

この控えめな仮想マシンでは、アップスケーリングプロセスは 30 秒未満で完了し、一時的な RAM 使用量は 1 GB に達しました。その後、アプリは 9272*4900 の解像度でアップスケーリングされた画像を表示しました。ただし、画像要素、特にテキストの品質は大幅に低下し、判読不能になりました。

残念ながら、生成された画像を大きな形式や全画面モードでプレビューする機能はなく、画像を直接ディスクにダウンロードするオプションもありません。

次に、画像内の人物の位置を突き止めるために設計された「Detect Human Pose 」という別のモデルのテストに進みました。このモデルは、単純な歩行人物を正常に認識しただけでなく、複数のアプリケーションが開いているデスクトップのスクリーンショット上に位置マーカーを表示し始めました。

これらのモデルをアプリケーションに統合する正確な方法は不明ですが、一部の機能は確かにローカルで実行できます。ただし、PC にはこれらのモデル用の十分なストレージスペース、強力な CPU、および少なくとも 16 GB の RAM が必要になります。

これについてどう思いますか? テキストプロンプトを画像に変換するために 5 GB の大容量モデルをダウンロードする価値はあるでしょうか、それとも Web ベースのアプリケーションを使用して 30 秒待つ方が効率的でしょうか? これらの機能の多くは特定のユースケースや運用環境に対応しており、必ずしも Windows 11 の幅広いユーザー層にアピールするものではないことは明らかです。

出典と画像

モデルの評価

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル