O Microsoft Edge utiliza o OCR do Windows 11 para extração de texto de PDFs e imagens digitalizados

2024/12/12

O Microsoft Edge está melhorando continuamente, e descobrimos uma nova funcionalidade intrigante que está sendo avaliada internamente. Esse recurso é conhecido como “OCR para PDF”. Atualmente, quando os usuários abrem um documento PDF digitalizado, que consiste principalmente de imagens, eles não conseguem selecionar, copiar ou pesquisar texto dentro dele.

Essa limitação apresenta desafios ao tentar extrair texto de materiais digitalizados, levando muitos usuários a recorrer a ferramentas internas para extração de texto ou a depender de serviços online não confiáveis que oferecem recursos de “extrair texto de PDF digitalizado”. Felizmente, parece que esse incômodo pode ser eliminado em breve, já que o Windows Latest relatou um recurso experimental no Edge que integra OCR ao leitor de PDF.

Para aqueles que podem não estar familiarizados, OCR se refere a Reconhecimento Óptico de Caracteres. Em suas observações, o Windows Latest identificou um sinalizador dentro do Microsoft Edge rotulado como “msPdfWindowsOcrCoverage”, que sugere o uso potencial de um mecanismo de OCR integrado para recuperar texto de imagens.

Este desenvolvimento aproveita a funcionalidade de OCR que veio com o Windows 10, também parte da Plataforma Universal do Windows (UWP), permitindo que os aplicativos extraiam informações de texto e layout no Windows 10 e versões posteriores.

Embora a Microsoft ainda não tenha confirmado a integração do OCR do Windows no leitor de PDF do Microsoft Edge, fontes indicaram que a tecnologia OCR do Windows 11 é altamente eficiente no reconhecimento de texto em vários tipos de imagem.

Essas imagens incluem não apenas “documentos digitalizados (.pdf)”, mas também fotografias padrão.

Além disso, o recurso OCR no Windows 11 opera nativamente no seu dispositivo, o que significa que ele não transmite seus dados para a Microsoft, nem requer conectividade com a internet para funcionar. Esse recurso também suporta até 25 idiomas diferentes.

Vários aplicativos populares, como Word, OneNote, Bing e OneDrive, utilizam a API de OCR do Windows há anos, e ela finalmente está chegando ao Microsoft Edge.

A intenção parece ser aumentar a utilidade dos documentos PDF, permitindo que os usuários copiem texto facilmente e melhorem a acessibilidade. Como esse ainda é um recurso experimental, indicado por seu status como um sinalizador, ele pode ainda não estar totalmente funcional para todos os usuários. Para testá-lo, você pode localizar o sinalizador nas configurações do Edge em edge://flags, habilitá-lo e reiniciar o navegador.

Isso poderia melhorar muito os recursos do Edge no gerenciamento de PDFs não pesquisáveis.

Embora não tenhamos um cronograma específico para quando o suporte ao OCR de PDF será lançado no Microsoft Edge, certamente não é a única melhoria interessante no horizonte para o navegador.

Comparação de caixa de composição de borda no webui 2.0

De acordo com relatórios anteriores do Windows Latest, a Microsoft também está focada em melhorar a velocidade de desempenho do navegador Edge. Insights sugerem que melhorias estão a caminho para o menu de downloads, menu de extensões, aba de histórico, menu de três pontos e até mesmo o menu de clique direito conhecido como “Ask Copilot”, todos prometendo ser significativamente mais rápidos.

Deixe um comentário Cancelar resposta