手書き文書をテキストに変換する方法

手書き文書をテキストに変換する方法
Pexels Pixabay 51191

手書きの文書が山積みで、簡単に編集、共有、保存できるようにデジタル化したい場合、手書きテキスト変換 (HTR) テクノロジが役に立ちます。このテクノロジを使用すると、簡単な手順で手書きの文書をテキストに変換できます。必要なのはスキャナーとソフトウェアだけです。

手書き文書のスキャンの課題

手書きの文書をスキャンしてデジタル テキストに変換するのは、次のような独特の課題が伴うため、非常に面倒な作業です。

  • 手書きは人によって異なるため、標準的な光学式文字認識 (OCR) ソフトウェアではテキストを正確に認識して転記することが困難です。
  • 手書きの文書には、取り消し線が引かれた単語やスペルミスなどの誤りが含まれることが多く、スキャン ソフトウェアをさらに混乱させる可能性があります。

これらの課題やその他の課題に対処するために、ソフトウェア開発者は、手書き文書をテキストに変換する作業専用に設計された、特殊な Handwriting to Text (HTR) ソフトウェアを作成しました。

HTR ツールは高度なアルゴリズムを使用して、さまざまな手書きスタイルに適応し、意図的なテキストと余分なマークや修正を区別し、古い文書や破損した文書を処理します。

Transkribus を使用して手書き文書をテキストに変換する

手書き文書をテキストに変換する場合、HTR ツールは数多くあります。しかし、私が最もお勧めするのはTranskribusです。これはデスクトップ版を備えたオンライン ソフトウェアで、非常に簡単に習得でき、トレーニングしてパフォーマンスを向上させることができます。

Transkribus ですぐに使える結果は期待外れかもしれません。しかし、このツールの真の力はトレーニング インターフェースにあります。少しの時間と労力を費やせば、Transkribus が手書き文字をより正確に認識するようにトレーニングでき、転写の品質を大幅に向上させることができます。

Transkribus の無料バージョンでは、最大 100 のドキュメントを変換し、1 か月に最大 5 回のトレーニングを実行できます (詳細は後ほど説明します)。開始するには、ツールの Web サイトにアクセスし、[無料で試す]ボタンをクリックして、ユーザー アカウントを作成します。

Transkribus 無料でお試し

ドキュメントの変換を開始するには、 Transkribus でデフォルトのコレクションを開きます。コレクションは、作業を整理できるフォルダーのようなもので、各コレクションには個別のドキュメントが含まれています。各ドキュメントは、テキストの実際のページを表す画像で構成されています。

Transkribus デフォルトコレクション

ドキュメントを追加するには、[ファイルのアップロード]ボタンをクリックします。Transkribus は、JPEG、PNG、PDF などのさまざまな形式を受け入れますが、最適な認識のためには 300 DPI の JPEG を使用することをお勧めします。ドキュメントをアップロードしたら、手書きのドキュメントをテキストに変換する準備が整います。

Transkribus アップロード ファイル

ドキュメントを開き、変換するすべての画像を選択します。「認識」ボタンをクリックします。

Transkribus 認識ボタン

Transkribus は、さまざまな言語と時代に対応したさまざまな公開モデルを提供しています。トレーニングなしですぐにテキスト認識を行うには、ドキュメントの特性に最も一致するモデルを選択し、[認識の開始]ボタンをクリックして待機します。私はThe English Eagleモデルを使用しました。

トランスクリブス イングリッシュ イーグル

無料ユーザーが作成した手書きテキスト認識ジョブは優先度が低いため、Transkribus が完了するまでに時間がかかる場合があります。

トランスクリバスの結果

認識処理後、Transkribus ドキュメント エディターを使用して結果を微調整します。テキストと画像の表示が同期されるため、編集プロセスが直感的に行えます。タグを使用して、エンティティ、イベント、または不確かな転写をマークできます。

HTR パフォーマンスを向上させるカスタム モデルをトレーニングする

カスタム モデルをトレーニングするには、グラウンド トゥルース データを準備します。これには、モデルに認識させたい書き方に一致する手書き文書のセットを正確に書き写すことが含まれます。データが多様で代表的であるほど、モデルのパフォーマンスは向上します。

Transkribus テキスト認識モデルをトレーニング

モデルをトレーニングするには、[新しいモデルのトレーニング]ボタンをクリックします。[テキスト認識モデル]オプションを選択し、グラウンド トゥルース ドキュメントを含むコレクションを選択してから、トレーニング データと検証データに含めるページを選択します。トレーニング データはモデルのパラメータを適合させるために使用され、検証データはモデルのパフォーマンスの偏りのない評価を提供します。

Transkribus モデルトレーニングのセットアップ

言語や文字セットなどのモデルの設定を構成してトレーニング プロセスを開始します。トレーニング プロセスには、モデルがデータから学習する複数のサイクルまたは「エポック」が含まれます。モデルのパフォーマンスが向上しなくなった場合、Transkribus は自動的にトレーニングを停止します。

トレーニング後、カスタム モデルを使用して、精度を高めて新しいドキュメントを書き写します。

Transkribus の代替品

Transkribus は手書き文書をテキストに変換する私の第一の選択肢ですが、他にも優れた選択肢がたくさんあります。

  • Pen2Txt はHTR 業界の新参者です。最新の AI 技術を活用してさまざまな手書きスタイルに適応し、高い精度を実現することを目指しています。まだ開発中ですが、Pen2Txt はユーザーフレンドリーなインターフェイスと安定したパフォーマンスを提供します。ただし、無料ユーザーは 3 回のみの変換に制限されています。
  • Google Document AI は、 Google の AI を活用したドキュメント処理ツール スイートの一部です。トレーニングなしですぐに使用できる優れた認識機能を備えているため、迅速な変換に最適です。このツールを試すには 300 ドル分の無料クレジットが付与されますが、継続して使用するには変換ごとに料金を支払う必要があります。
  • GrabTextは、写真、グラフィック、ドキュメントから手書きまたは印刷されたテキストをキャプチャし、編集可能なテキストに変換するシンプルなオンライン ツールです。テキストをキャプチャし、自動修正 (スペルや文法を含む) を適用し、変換したテキストをさまざまな形式でエクスポートするという、3 つの簡単な手順で実行できます。残念ながら、無料で使用するには友人を招待する必要があります。

Transkribus または上記の代替手段のいずれかを選択すると、ドキュメントを簡単にデジタル化できます。より多くのオプションを探している場合は、Android で OCR を使用して画像をテキストに変換する方法を学んでください。

画像クレジット: Pixabay。すべてのスクリーンショットはDavid Moreloによるものです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です