Microsoft Edge sfrutta l’OCR di Windows 11 per l’estrazione di testo da PDF e immagini scansionati
Microsoft Edge è in continuo miglioramento e abbiamo scoperto una nuova funzionalità interessante attualmente in fase di valutazione interna. Questa funzionalità è nota come “OCR per PDF”. Attualmente, quando gli utenti aprono un documento PDF scansionato, che consiste principalmente di immagini, non sono in grado di selezionare, copiare o cercare testo al suo interno.
Questa limitazione pone delle sfide quando si tenta di estrarre testo da materiali scansionati, portando molti utenti a ricorrere a strumenti interni per l’estrazione del testo o a fare affidamento su servizi online inaffidabili che offrono funzionalità di “estrazione del testo da PDF scansionato”. Fortunatamente, sembra che questa seccatura potrebbe essere presto eliminata, poiché Windows Latest ha segnalato una funzionalità sperimentale in Edge che integra l’OCR nel lettore PDF.
Per chi non lo sapesse, OCR si riferisce a Optical Character Recognition. Nelle sue osservazioni, Windows Latest ha identificato un flag all’interno di Microsoft Edge etichettato “msPdfWindowsOcrCoverage”, che suggerisce il potenziale utilizzo di un motore OCR integrato per recuperare il testo dalle immagini.
Questo sviluppo sfrutta la funzionalità OCR fornita con Windows 10, anch’essa parte della piattaforma Universal Windows Platform (UWP), consentendo alle applicazioni di estrarre informazioni di testo e layout su Windows 10 e versioni successive.
Sebbene Microsoft non abbia ancora confermato l’integrazione di Windows OCR nel lettore PDF di Microsoft Edge, alcune fonti hanno indicato che la tecnologia OCR di Windows 11 è altamente efficiente nel riconoscere il testo in vari tipi di immagini.
Queste immagini includono non solo “documenti scansionati (.pdf)”, ma anche fotografie standard.
Inoltre, la funzionalità OCR in Windows 11 funziona in modo nativo sul tuo dispositivo, il che significa che non trasmette i tuoi dati a Microsoft, né richiede la connettività Internet per funzionare. Questa funzionalità supporta anche fino a 25 lingue diverse.
Numerose applicazioni popolari, come Word, OneNote, Bing e OneDrive, utilizzano da anni l’API OCR di Windows, che finalmente sta arrivando anche su Microsoft Edge.
L’intenzione sembra essere quella di migliorare l’utilità dei documenti PDF consentendo agli utenti di copiare facilmente il testo e migliorare l’accessibilità. Poiché questa è ancora una funzionalità sperimentale, indicata dal suo stato di flag, potrebbe non essere ancora completamente funzionale per tutti gli utenti. Per testarla, puoi individuare il flag nelle impostazioni di Edge in edge://flags, abilitarlo e quindi riavviare il browser.
Ciò potrebbe migliorare notevolmente le capacità di Edge nella gestione dei PDF non ricercabili.
Sebbene non abbiamo una tempistica specifica per l’implementazione del supporto OCR PDF in Microsoft Edge, non si tratta certamente dell’unico miglioramento entusiasmante all’orizzonte per il browser.
Secondo precedenti report di Windows Latest, Microsoft si sta anche concentrando sul miglioramento della velocità delle prestazioni del browser Edge. Le informazioni suggeriscono che sono in arrivo miglioramenti per il menu dei download, il menu delle estensioni, la scheda della cronologia, il menu a tre punti e persino il menu di scelta rapida noto come “Ask Copilot”, tutti promettenti per essere significativamente più veloci.
Lascia un commento