Microsoft Edge 利用 Windows 11 OCR 從掃描的 PDF 和圖像中提取文本

2024/12/12

Microsoft Edge 正在不斷改進，我們發現了一項目前正在內部評估的有趣的新功能。此功能稱為「PDF 的 OCR」。目前，當使用者開啟主要由影像組成的掃描 PDF 文件時，他們無法選擇、複製或搜尋其中的文字。

當嘗試從掃描的材料中提取文本時，這種限制帶來了挑戰，導致許多用戶求助於內部工具來提取文本，或者依賴提供「從掃描的 PDF 中提取文本」功能的不可靠的在線服務。幸運的是，這種麻煩似乎很快就會被消除，因為 Windows Latest 報導了 Edge 中的一項實驗性功能，該功能將 OCR 整合到 PDF 閱讀器中。

對於可能不熟悉的人來說，OCR 指的是光學字元辨識。在他們的觀察中，Windows Latest 在 Microsoft Edge 中發現了一個標記為「msPdfWindowsOcrCoverage」的標誌，這表明可能使用內建 OCR 引擎從圖像中檢索文字。

此開發利用 Windows 10 附帶的 OCR 功能（也是通用 Windows 平台 (UWP) 的一部分），使應用程式能夠跨 Windows 10 及更高版本提取文字和佈局資訊。

雖然微軟尚未確認將 Windows OCR 整合到 Microsoft Edge 的 PDF 閱讀器中，但消息人士表示，Windows 11 中的 OCR 技術非常擅長識別各種圖像類型的文字。

這些圖像不僅包括“掃描文件（.pdf）”，還包括標準照片。

此外，Windows 11 中的 OCR 功能在您的裝置上本機運行，這意味著它不會將您的資料傳輸給 Microsoft，也不需要網路連線即可運作。此功能還支援多達 25 種不同的語言。

許多流行的應用程式（例如 Word、OneNote、Bing 和 OneDrive）多年來一直使用 Windows OCR API，現在它終於進入了 Microsoft Edge。

其目的似乎是透過使用戶能夠輕鬆複製文字並提高可訪問性來增強 PDF 文件的實用性。由於這仍然是一個實驗性功能（由其作為標誌的狀態表明），因此它可能尚未對所有用戶完全起作用。要測試它，您可以在 Edge 設定中找到該標誌：edge://flags，啟用它，然後重新啟動瀏覽器。

這可以大大增強 Edge 管理不可搜尋 PDF 的能力。

儘管我們沒有在 Microsoft Edge 中推出 PDF OCR 支援的具體時間表，但這肯定不是該瀏覽器即將推出的唯一令人興奮的增強功能。

根據 Windows Late 先前報導，微軟也致力於提升 Edge 瀏覽器的效能速度。洞察表明，下載選單、擴展選單、歷史選項卡、三點菜單，甚至被稱為「詢問副駕駛」的右鍵選單都正在進行增強，所有這些都有望顯著加快。

發佈留言 取消回覆

發佈留言取消回覆