Microsoft Edge 利用 Windows 11 OCR 從掃描的 PDF 和圖像中提取文本

Microsoft Edge 利用 Windows 11 OCR 從掃描的 PDF 和圖像中提取文本

Microsoft Edge 正在不斷改進,我們發現了一項目前正在內部評估的有趣的新功能。此功能稱為「PDF 的 OCR」。目前,當使用者開啟主要由影像組成的掃描 PDF 文件時,他們無法選擇、複製或搜尋其中的文字。

當嘗試從掃描的材料中提取文本時,這種限制帶來了挑戰,導致許多用戶求助於內部工具來提取文本,或者依賴提供「從掃描的 PDF 中提取文本」功能的不可靠的在線服務。幸運的是,這種麻煩似乎很快就會被消除,因為 Windows Latest 報導了 Edge 中的一項實驗性功能,該功能將 OCR 整合到 PDF 閱讀器中。

對於可能不熟悉的人來說,OCR 指的是光學字元辨識。在他們的觀察中,Windows Latest 在 Microsoft Edge 中發現了一個標記為「msPdfWindowsOcrCoverage」的標誌,這表明可能使用內建 OCR 引擎從圖像中檢索文字。

此開發利用 Windows 10 附帶的 OCR 功能(也是通用 Windows 平台 (UWP) 的一部分),使應用程式能夠跨 Windows 10 及更高版本提取文字和佈局資訊。

雖然微軟尚未確認將 Windows OCR 整合到 Microsoft Edge 的 PDF 閱讀器中,但消息人士表示,Windows 11 中的 OCR 技術非常擅長識別各種圖像類型的文字。

這些圖像不僅包括“掃描文件(.pdf)”,還包括標準照片。

此外,Windows 11 中的 OCR 功能在您的裝置上本機運行,這意味著它不會將您的資料傳輸給 Microsoft,也不需要網路連線即可運作。此功能還支援多達 25 種不同的語言。

許多流行的應用程式(例如 Word、OneNote、Bing 和 OneDrive)多年來一直使用 Windows OCR API,現在它終於進入了 Microsoft Edge。

其目的似乎是透過使用戶能夠輕鬆複製文字並提高可訪問性來增強 PDF 文件的實用性。由於這仍然是一個實驗性功能(由其作為標誌的狀態表明),因此它可能尚未對所有用戶完全起作用。要測試它,您可以在 Edge 設定中找到該標誌:edge://flags,啟用它,然後重新啟動瀏覽器。

這可以大大增強 Edge 管理不可搜尋 PDF 的能力。

儘管我們沒有在 Microsoft Edge 中推出 PDF OCR 支援的具體時間表,但這肯定不是該瀏覽器即將推出的唯一令人興奮的增強功能。

webui 2.0 中的邊緣撰寫框比較

根據 Windows Late 先前報導,微軟也致力於提升 Edge 瀏覽器的效能速度。洞察表明,下載選單、擴展選單、歷史選項卡、三點菜單,甚至被稱為「詢問副駕駛」的右鍵選單都正在進行增強,所有這些都有望顯著加快。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *