손으로 쓴 문서를 텍스트로 변환하는 방법
손수 쓴 문서가 쌓여서 편집, 공유, 저장이 쉬운 디지털화가 필요하다면, 손수 쓴 문서를 텍스트로 변환(HTR) 기술이 여러분을 구해드릴 것입니다. 이 기술을 사용하면 몇 가지 간단한 단계만으로 손수 쓴 문서를 텍스트로 변환할 수 있으며, 스캐너와 소프트웨어만 있으면 됩니다.
손으로 쓴 문서 스캔의 과제
손으로 쓴 문서를 스캔하여 디지털 텍스트로 변환하는 작업은 고유한 일련의 과제를 수반하기 때문에 실제로 골치 아픈 일일 수 있습니다.
- 사람마다 필체가 다르기 때문에 표준 광학 문자 인식(OCR) 소프트웨어로는 텍스트를 정확하게 인식하고 입력하기 어렵습니다.
- 손으로 쓴 문서에는 종종 취소선이 그어진 단어나 철자 오류와 같은 오류가 포함되어 있어 스캐닝 소프트웨어가 더욱 혼란스러워할 수 있습니다.
이러한 문제와 다른 과제에 대처하기 위해 소프트웨어 개발자들은 손으로 쓴 문서를 텍스트로 변환하는 작업에 특별히 맞춰 설계된 특수한 필기 입력 텍스트 변환(HTR) 소프트웨어를 개발했습니다.
HTR 도구는 고급 알고리즘을 사용하여 다양한 필기 스타일을 적응시키고, 의도적인 텍스트와 엉뚱한 표시나 수정 사항을 구별하고, 오래되거나 손상된 문서를 처리합니다.
Transkribus를 사용하여 손으로 쓴 문서를 텍스트로 변환
손으로 쓴 문서를 텍스트로 변환하는 데는 많은 HTR 도구가 있습니다. 그러나 제가 가장 추천하는 것은 Transkribus 입니다 . 데스크톱 버전이 있는 온라인 소프트웨어로, 매우 쉽게 사용할 수 있으며, 성능을 개선하도록 훈련할 수 있습니다.
Transkribus를 사용하면 상자 밖에서는 결과가 실망스러울 수 있습니다. 그러나 이 도구의 진정한 힘은 훈련 인터페이스에 있습니다. 시간과 노력을 기울이면 Transkribus가 필체를 더 정확하게 인식하도록 훈련할 수 있으며, 이를 통해 필사의 품질을 크게 향상시킬 수 있습니다.
Transkribus의 무료 버전을 사용하면 최대 100개의 문서를 변환하고 한 달에 최대 5개의 트레이닝을 실행할 수 있습니다(자세한 내용은 곧 알려드리겠습니다). 시작하려면 도구 웹사이트를 방문하여 무료로 체험 버튼을 클릭하고 사용자 계정을 만드세요.
문서 변환을 시작하려면 Transkribus에서 기본 컬렉션을 엽니다 . 컬렉션은 작업을 구성할 수 있는 폴더로 생각하세요. 각 컬렉션에는 개별 문서가 들어 있습니다. 각 문서는 텍스트의 실제 페이지를 나타내는 이미지 로 구성됩니다.
문서를 추가하려면 파일 업로드 버튼을 클릭하세요. Transkribus는 JPEG, PNG, PDF 등 다양한 형식을 허용하지만 최적의 인식을 위해 300 DPI JPEG를 사용하는 것이 좋습니다. 문서가 업로드되면 손으로 쓴 문서를 텍스트로 변환할 준비가 된 것입니다.
문서를 열고 변환하려는 모든 이미지를 선택합니다. 인식 버튼을 클릭합니다.
Transkribus는 다양한 언어와 시간대에 대한 다양한 공개 모델을 제공합니다. 아무런 훈련 없이도 즉시 텍스트를 인식하려면 문서의 특성과 가장 잘 맞는 모델을 선택한 다음 인식 시작 버튼을 클릭하고 기다리세요. 저는 The English Eagle 모델을 사용했습니다 .
무료 사용자가 생성한 손으로 쓴 텍스트 인식 작업은 우선순위가 낮으므로 Transkribus에서 완료하는 데 시간이 걸릴 수 있습니다.
인식 프로세스 후 Transkribus 문서 편집기를 사용하여 결과를 미세 조정합니다. 직관적인 편집 프로세스를 위해 텍스트와 이미지 뷰를 동기화합니다. 태그를 사용하여 엔터티, 이벤트 또는 불확실한 필사본을 표시할 수 있습니다.
HTR 성능 개선을 위한 사용자 정의 모델 학습
사용자 지정 모델을 훈련하려면 실제 데이터를 준비합니다. 여기에는 모델이 인식하기를 원하는 필기 스타일과 일치하는 일련의 손으로 쓴 문서를 정확하게 필사하는 것이 포함됩니다. 데이터가 더 다양하고 대표적일수록 모델이 더 잘 수행됩니다.
모델을 학습하려면 Train New Model 버튼을 클릭합니다. Text Recognition Model 옵션을 선택하고 Ground Truth 문서가 포함된 컬렉션을 선택한 다음 학습 및 검증 데이터에 포함할 페이지를 선택합니다. 학습 데이터는 모델의 매개변수에 맞추는 데 사용되는 반면 검증 데이터는 모델의 성능에 대한 편향 없는 평가를 제공합니다.
모델 설정을 구성하여 언어 및 문자 집합과 같은 학습 프로세스를 시작합니다. 여기에는 모델이 데이터에서 학습하는 여러 사이클 또는 “에포크”가 포함됩니다. Transkribus는 모델의 성능이 더 이상 향상되지 않으면 자동으로 학습을 중단합니다.
훈련이 끝나면 사용자 지정 모델을 사용하여 더욱 정확한 새로운 문서를 필사할 수 있습니다.
Transkribus의 대안
Transkribus는 손으로 쓴 문서를 텍스트로 변환하는 데 있어서 제가 가장 선호하는 서비스이지만, 그 외에도 훌륭한 옵션이 많이 있습니다.
- Pen2Txt 는 HTR 분야의 신인입니다. 다양한 필기 스타일에 적응하기 위해 최신 AI 기술을 활용하여 높은 정확도를 제공하는 것을 목표로 합니다. 아직 진행 중이지만 Pen2Txt는 사용자 친화적인 인터페이스와 견고한 성능을 제공합니다. 그러나 무료 사용자는 3개의 변환으로 제한됩니다.
- Google Document AI는 Google의 AI 기반 문서 처리 도구 모음의 일부입니다. 훈련 없이도 뛰어난 기본 인식 기능을 제공하므로 빠른 변환을 위한 견고한 선택입니다. 도구를 사용해 볼 수 있는 무료 크레딧 300달러를 받을 수 있지만, 계속 사용하려면 변환당 비용을 지불해야 합니다.
- GrabText 는 사진, 그래픽, 문서에서 손으로 쓴 텍스트나 인쇄된 텍스트를 캡처하여 편집 가능한 텍스트로 변환하는 간단한 온라인 도구입니다. 간단한 3단계 프로세스를 제공합니다. 텍스트를 캡처하고, 자동 수정(철자 및 문법 포함)을 적용하고, 변환된 텍스트를 다양한 형식으로 내보냅니다. 안타깝게도 무료로 사용하려면 친구를 초대해야 합니다.
Transkribus를 선택하든 위에 언급된 대안 중 하나를 선택하든, 문서를 쉽게 디지털화할 수 있습니다. 더 많은 옵션을 찾고 있다면 Android에서 OCR을 사용하여 이미지를 텍스트로 변환하는 방법을 알아보세요.
이미지 출처: Pixabay . 모든 스크린샷은 David Morelo가 촬영했습니다.
답글 남기기