Microsoft Edge exploite l’OCR de Windows 11 pour l’extraction de texte à partir de fichiers PDF et d’images numérisés

2024/12/12

Microsoft Edge s’améliore en permanence et nous avons découvert une nouvelle fonctionnalité intéressante actuellement évaluée en interne. Cette fonctionnalité est connue sous le nom de « OCR pour PDF ». Actuellement, lorsque les utilisateurs ouvrent un document PDF numérisé, qui se compose principalement d’images, ils ne peuvent pas sélectionner, copier ou rechercher du texte à l’intérieur.

Cette limitation pose des problèmes lors de l’extraction de texte à partir de documents numérisés, ce qui conduit de nombreux utilisateurs à recourir à des outils internes pour l’extraction de texte ou à s’appuyer sur des services en ligne peu fiables qui offrent des fonctionnalités « d’extraction de texte à partir de PDF numérisés ». Heureusement, il semble que ce problème pourrait bientôt être éliminé, car Windows Latest a signalé une fonctionnalité expérimentale dans Edge qui intègre l’OCR dans le lecteur PDF.

Pour ceux qui ne le savent pas, OCR signifie reconnaissance optique de caractères. Dans leurs observations, Windows Latest a identifié un indicateur dans Microsoft Edge intitulé « msPdfWindowsOcrCoverage », qui suggère l’utilisation potentielle d’un moteur OCR intégré pour récupérer du texte à partir d’images.

Ce développement exploite la fonctionnalité OCR fournie avec Windows 10, également une partie de la plateforme Windows universelle (UWP), permettant aux applications d’extraire du texte et des informations de mise en page sur Windows 10 et les versions ultérieures.

Bien que Microsoft n’ait pas encore confirmé l’intégration de Windows OCR dans le lecteur PDF de Microsoft Edge, des sources ont indiqué que la technologie OCR de Windows 11 est très efficace pour reconnaître du texte sur différents types d’images.

Ces images incluent non seulement des « documents numérisés (.pdf) » mais également des photographies standard.

De plus, la fonction OCR de Windows 11 fonctionne de manière native sur votre appareil, ce qui signifie qu’elle ne transmet pas vos données à Microsoft et qu’elle ne nécessite pas de connexion Internet pour fonctionner. Cette fonctionnalité prend également en charge jusqu’à 25 langues différentes.

De nombreuses applications populaires, telles que Word, OneNote, Bing et OneDrive, utilisent l’API OCR de Windows depuis des années, et elle fait enfin son chemin vers Microsoft Edge.

L’objectif semble être d’améliorer l’utilité des documents PDF en permettant aux utilisateurs de copier facilement du texte et d’améliorer l’accessibilité. Comme il s’agit encore d’une fonctionnalité expérimentale, indiquée par son statut d’indicateur, elle peut ne pas encore être entièrement fonctionnelle pour tous les utilisateurs. Pour la tester, vous pouvez localiser l’indicateur dans les paramètres Edge à l’adresse edge://flags, l’activer, puis redémarrer le navigateur.

Cela pourrait grandement améliorer les capacités d’Edge dans la gestion des PDF non consultables.

Bien que nous n’ayons pas de calendrier précis concernant le déploiement de la prise en charge de l’OCR PDF dans Microsoft Edge, ce n’est certainement pas la seule amélioration intéressante à l’horizon pour le navigateur.

Comparaison des zones de composition Edge dans l'interface Web 2.0

Selon les rapports précédents de Windows Latest, Microsoft se concentre également sur l’amélioration de la vitesse des performances du navigateur Edge. Les informations suggèrent que des améliorations sont en cours pour le menu des téléchargements, le menu des extensions, l’onglet historique, le menu à trois points et même le menu contextuel connu sous le nom de « Ask Copilot », tous promettant d’être nettement plus rapides.

Laisser un commentaire Annuler la réponse