Microsoft Edge aprovecha el OCR de Windows 11 para la extracción de texto de archivos PDF e imágenes escaneados

2024/12/12

Microsoft Edge mejora continuamente y hemos descubierto una nueva función interesante que actualmente se está evaluando internamente. Esta función se conoce como «OCR para PDF». Actualmente, cuando los usuarios abren un documento PDF escaneado, que consta principalmente de imágenes, no pueden seleccionar, copiar ni buscar texto dentro de él.

Esta limitación plantea desafíos a la hora de intentar extraer texto de materiales escaneados, lo que lleva a muchos usuarios a recurrir a herramientas internas para la extracción de texto o a confiar en servicios en línea poco fiables que ofrecen capacidades de «extraer texto de PDF escaneados». Afortunadamente, parece que este problema puede eliminarse pronto, ya que Windows Latest ha informado sobre una función experimental en Edge que integra el OCR en el lector de PDF.

Para quienes no lo sepan, OCR se refiere al reconocimiento óptico de caracteres. En sus observaciones, Windows Latest identificó una bandera dentro de Microsoft Edge denominada “msPdfWindowsOcrCoverage”, que sugiere el posible uso de un motor de OCR integrado para recuperar texto de imágenes.

Este desarrollo aprovecha la funcionalidad de OCR que viene con Windows 10, también parte de la Plataforma universal de Windows (UWP), lo que permite que las aplicaciones extraigan información de texto y diseño en Windows 10 y versiones posteriores.

Si bien Microsoft aún no ha confirmado la integración de Windows OCR en el lector de PDF de Microsoft Edge, las fuentes han indicado que la tecnología OCR en Windows 11 es muy competente para reconocer texto en varios tipos de imágenes.

Estas imágenes incluyen no sólo “documentos escaneados (.pdf)” sino también fotografías estándar.

Además, la función OCR de Windows 11 funciona de forma nativa en tu dispositivo, lo que significa que no transmite tus datos a Microsoft ni requiere conexión a Internet para funcionar. Esta función también admite hasta 25 idiomas diferentes.

Numerosas aplicaciones populares, como Word, OneNote, Bing y OneDrive, han utilizado la API de OCR de Windows durante años y finalmente está llegando a Microsoft Edge.

La intención parece ser mejorar la utilidad de los documentos PDF al permitir a los usuarios copiar texto fácilmente y mejorar la accesibilidad. Dado que esta es todavía una función experimental, como lo indica su estado como bandera, es posible que aún no sea completamente funcional para todos los usuarios. Para probarla, puede buscar la bandera en la configuración de Edge en edge://flags, habilitarla y luego reiniciar el navegador.

Esto podría mejorar enormemente las capacidades de Edge en la gestión de archivos PDF que no se pueden buscar.

Si bien no tenemos un cronograma específico sobre cuándo se implementará la compatibilidad con PDF OCR en Microsoft Edge, ciertamente no es la única mejora interesante en el horizonte para el navegador.

Comparación del cuadro de redacción de Edge en WebUI 2.0

Según informes anteriores de Windows Latest, Microsoft también está centrado en mejorar la velocidad de rendimiento del navegador Edge. Los datos sugieren que se están preparando mejoras para el menú de descargas, el menú de extensiones, la pestaña de historial, el menú de tres puntos e incluso el menú del botón derecho conocido como «Ask Copilot», todos ellos que prometen ser significativamente más rápidos.

Deja una respuesta Cancelar la respuesta