Microsoft Edge nutzt Windows 11 OCR zur Textextraktion aus gescannten PDFs und Bildern

2024/12/12

Microsoft Edge wird ständig verbessert und wir haben eine interessante neue Funktion entdeckt, die derzeit intern getestet wird. Diese Funktion ist als „OCR für PDF“ bekannt. Wenn Benutzer derzeit ein gescanntes PDF-Dokument öffnen, das hauptsächlich aus Bildern besteht, können sie darin keinen Text auswählen, kopieren oder suchen.

Diese Einschränkung stellt eine Herausforderung dar, wenn versucht wird, Text aus gescannten Materialien zu extrahieren. Viele Benutzer greifen daher auf interne Tools zur Textextraktion zurück oder verlassen sich auf unzuverlässige Onlinedienste, die Funktionen zum „Extrahieren von Text aus gescannten PDFs“ anbieten. Glücklicherweise scheint dieser Ärger bald beseitigt zu sein, da Windows Latest über eine experimentelle Funktion in Edge berichtet hat, die OCR in den PDF-Reader integriert.

Für diejenigen, die es vielleicht nicht kennen: OCR steht für Optical Character Recognition (optische Zeichenerkennung). In seinen Beobachtungen hat Windows Latest in Microsoft Edge eine Markierung mit der Bezeichnung „msPdfWindowsOcrCoverage“ identifiziert, die auf die mögliche Verwendung einer integrierten OCR-Engine zum Abrufen von Text aus Bildern hinweist.

Diese Entwicklung nutzt die OCR-Funktionalität von Windows 10, das ebenfalls Teil der Universal Windows Platform (UWP) ist, und ermöglicht es Anwendungen, Text- und Layoutinformationen aus Windows 10 und späteren Versionen zu extrahieren.

Während Microsoft die Integration von Windows OCR in den PDF-Reader von Microsoft Edge noch nicht bestätigt hat, haben Quellen darauf hingewiesen, dass die OCR-Technologie in Windows 11 sehr gut darin ist, Text in verschiedenen Bildtypen zu erkennen.

Zu diesen Bildern zählen nicht nur „gescannte Dokumente (.pdf)“, sondern auch herkömmliche Fotos.

Darüber hinaus funktioniert die OCR-Funktion in Windows 11 nativ auf Ihrem Gerät, d. h. sie überträgt Ihre Daten nicht an Microsoft und erfordert auch keine Internetverbindung, um zu funktionieren. Diese Funktion unterstützt auch bis zu 25 verschiedene Sprachen.

Zahlreiche beliebte Anwendungen wie Word, OneNote, Bing und OneDrive verwenden die Windows OCR-API bereits seit Jahren und nun findet sie endlich auch ihren Weg in Microsoft Edge.

Die Absicht scheint darin zu bestehen, den Nutzen von PDF-Dokumenten zu verbessern, indem Benutzer Text einfach kopieren und die Zugänglichkeit verbessern können. Da es sich noch um eine experimentelle Funktion handelt (angezeigt durch den Status als Flag), ist sie möglicherweise noch nicht für alle Benutzer voll funktionsfähig. Um sie auszuprobieren, können Sie das Flag in den Edge-Einstellungen unter edge://flags finden, es aktivieren und dann den Browser neu starten.

Dies könnte die Fähigkeiten von Edge zur Verwaltung nicht durchsuchbarer PDFs erheblich verbessern.

Obwohl wir keinen konkreten Zeitplan dafür haben, wann die PDF-OCR-Unterstützung in Microsoft Edge eingeführt wird, ist dies sicherlich nicht die einzige spannende Verbesserung, die für den Browser in Sicht ist.

Vergleich von Edge-Compose-Boxen in WebUI 2.0

Laut früheren Berichten von Windows Latest konzentriert sich Microsoft auch darauf, die Leistungsgeschwindigkeit des Edge-Browsers zu verbessern. Erkenntnisse deuten darauf hin, dass Verbesserungen für das Download-Menü, das Erweiterungsmenü, die Registerkarte „Verlauf“, das Drei-Punkte-Menü und sogar das Rechtsklick-Menü „Ask Copilot“ geplant sind, die alle deutlich schneller sein sollen.

Schreibe einen Kommentar Antworten abbrechen