Microsoft Edge는 스캔된 PDF 및 이미지에서 텍스트 추출을 위해 Windows 11 OCR을 활용합니다.

2024/12/12

Microsoft Edge는 지속적으로 개선되고 있으며, 현재 내부적으로 평가 중인 흥미로운 새로운 기능을 발견했습니다. 이 기능은 “PDF용 OCR”이라고 합니다. 현재 사용자가 주로 이미지로 구성된 스캔된 PDF 문서를 열면 해당 문서 내에서 텍스트를 선택, 복사 또는 검색할 수 없습니다.

이러한 제한은 스캔한 자료에서 텍스트를 추출하려고 할 때 어려움을 초래하여 많은 사용자가 텍스트 추출을 위한 내부 도구에 의존하거나 “스캔한 PDF에서 텍스트 추출” 기능을 제공하는 신뢰할 수 없는 온라인 서비스에 의존하게 됩니다. 다행히도 Windows Latest에서 PDF 리더에 OCR을 통합하는 Edge의 실험적 기능에 대해 보고하면서 이러한 번거로움이 곧 사라질 것으로 보입니다.

익숙하지 않은 분들을 위해 설명드리자면, OCR은 Optical Character Recognition(광학 문자 인식)을 말합니다. Windows Latest는 관찰 결과 Microsoft Edge에서 “msPdfWindowsOcrCoverage”라는 플래그를 발견했는데, 이는 이미지에서 텍스트를 검색하기 위해 내장된 OCR 엔진을 사용할 가능성을 시사합니다.

이번 개발은 Windows 10과 함께 제공되는 OCR 기능을 활용하는데, 이 기능은 UWP(Universal Windows Platform)의 일부이기도 하며, 이를 통해 애플리케이션이 Windows 10 이상 버전에서 텍스트와 레이아웃 정보를 추출할 수 있습니다.

Microsoft에서는 아직 Windows OCR이 Microsoft Edge의 PDF 리더에 통합되었는지 확인하지 않았지만, 소식통에 따르면 Windows 11의 OCR 기술은 다양한 이미지 유형에서 텍스트를 인식하는 데 매우 능숙합니다.

이러한 이미지에는 “스캔한 문서(.pdf)”뿐만 아니라 표준 사진도 포함됩니다.

또한 Windows 11의 OCR 기능은 기본적으로 장치에서 작동하므로 Microsoft로 데이터를 전송하지 않으며 작동하기 위해 인터넷 연결이 필요하지 않습니다. 이 기능은 최대 25개의 다른 언어도 지원합니다.

Word, OneNote, Bing, OneDrive 등 많은 인기 애플리케이션이 수년간 Windows OCR API를 활용해 왔으며, 마침내 Microsoft Edge로 진출하게 되었습니다.

의도는 사용자가 텍스트를 쉽게 복사하고 접근성을 개선할 수 있도록 하여 PDF 문서의 유용성을 향상시키는 것으로 보입니다. 이것은 여전히 실험적 기능이기 때문에 플래그 상태로 표시되어 모든 사용자에게 아직 완전히 작동하지 않을 수 있습니다. 테스트하려면 edge://flags에서 Edge 설정에서 플래그를 찾아 활성화한 다음 브라우저를 다시 시작할 수 있습니다.

이를 통해 Edge의 검색 불가능한 PDF 관리 기능이 크게 향상될 수 있습니다.

Microsoft Edge에서 PDF OCR 지원이 언제 출시될지에 대한 구체적인 일정은 없지만, 이것이 브라우저에 적용될 유일하고 흥미로운 기능 향상은 분명 아닙니다.

Windows Latest의 이전 보고서에 따르면, Microsoft는 Edge 브라우저의 성능 속도 개선에도 주력하고 있습니다. 통찰력에 따르면 다운로드 메뉴, 확장 프로그램 메뉴, 기록 탭, 3개 점 메뉴, 심지어 “Ask Copilot”으로 알려진 오른쪽 클릭 메뉴까지 모두 상당히 빨라질 것이라고 약속하는 개선 사항이 진행 중이라고 합니다.

답글 남기기 응답 취소