Microsoft Edge はスキャンした PDF や画像からのテキスト抽出に Windows 11 OCR を活用します

2024/12/12

Microsoft Edge は継続的に改善されており、現在社内で評価されている興味深い新機能を発見しました。この機能は「PDF 用 OCR」と呼ばれています。現在、ユーザーがスキャンした PDF ドキュメント (主に画像で構成されている) を開いても、その中のテキストを選択、コピー、または検索することはできません。

この制限により、スキャンした資料からテキストを抽出しようとするときに問題が生じ、多くのユーザーがテキスト抽出に内部ツールに頼ったり、「スキャンした PDF からテキストを抽出」機能を提供する信頼性の低いオンラインサービスに頼ったりすることになります。幸いなことに、Windows Latest が、OCR を PDF リーダーに統合する Edge の実験的な機能について報告したように、この面倒はすぐに解消されるようです。

よく知らない人のために説明すると、OCR は光学式文字認識のことです。Windows Latest の観察によると、Microsoft Edge 内に「msPdfWindowsOcrCoverage」というフラグが見つかりました。これは、画像からテキストを取得するために組み込みの OCR エンジンが使用される可能性があることを示唆しています。

この開発では、ユニバーサル Windows プラットフォーム (UWP) の一部でもある Windows 10 に付属する OCR 機能を活用し、アプリケーションが Windows 10 以降のバージョン間でテキストとレイアウト情報を抽出できるようにします。

Microsoft は Windows OCR が Microsoft Edge の PDF リーダーに統合されることをまだ確認していませんが、情報筋によると、Windows 11 の OCR テクノロジはさまざまな種類の画像でテキストを認識する能力に非常に優れているとのことです。

これらの画像には、「スキャンされた文書 (.pdf)」だけでなく、標準的な写真も含まれます。

さらに、Windows 11 の OCR 機能はデバイス上でネイティブに動作します。つまり、データを Microsoft に送信したり、動作するためにインターネット接続を必要としたりすることはありません。この機能は、最大 25 の異なる言語もサポートします。

Word、OneNote、Bing、OneDrive などの数多くの人気アプリケーションは長年にわたり Windows OCR API を利用してきましたが、ついに Microsoft Edge にも導入されるようになりました。

この目的は、ユーザーがテキストを簡単にコピーできるようにしてアクセシビリティを向上させることで、PDF ドキュメントの有用性を高めることにあるようです。これはまだ実験的な機能であり、フラグのステータスで示されているように、すべてのユーザーにとってまだ完全に機能していない可能性があります。テストするには、Edge 設定の edge://flags でフラグを見つけて有効にし、ブラウザーを再起動します。

これにより、検索不可能な PDF を管理する Edge の機能が大幅に強化される可能性があります。

PDF OCR サポートが Microsoft Edge にいつ展開されるかについては具体的なスケジュールは決まっていませんが、これがこのブラウザーに今後予定されている唯一の魅力的な機能強化ではありません。

Windows Latest による以前のレポートによると、Microsoft は Edge ブラウザのパフォーマンス速度の向上にも注力しているようです。ダウンロードメニュー、拡張機能メニュー、履歴タブ、3 点メニュー、さらには「Ask Copilot」と呼ばれる右クリックメニューの機能強化が予定されており、いずれも大幅に高速化されると見込まれています。

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル