ホーム > データ(活用する) > NDLOCR-Liteの使い方

NDLOCR-Liteの使い方

NDLラボでは、マウス操作だけで簡単に利用できるOCRソフトウェア「NDLOCR-Lite」を開発・公開しています。

このソフトウェアを利用し、図書や雑誌資料の画像から文字部分をテキスト化(文字起し)することができます(機械的な判断結果のため、誤りを含みます。)。

このページではWindowsユーザを対象に、簡単な使い方をご紹介します。

なお、Macユーザに向けての使い方については、当館非常勤調査員でもある東京大学史料編纂所の中村覚先生の記事「NDL古典籍OCR-Lite(ndlkotenocr-lite)をMac OSで使用する(https://zenn.dev/nakamura196/articles/c62a465537ff20 )」が参考になります。

(1) OCRのダウンロード

次が、ダウンロードサイトのURLです、リンクをたどってブラウザで表示してください。

https://github.com/ndl-lab/ndlocr-lite/releases

ダウンロード画面

上のような画面が表示されます(バージョン番号(上の画像の場合は「v1.0.0」)は更新されている可能性があります。)。

ここでは、OSごとにダウンロードファイルを用意しています。利用したいOSのファイル(ファイル名に「windows」を含むzipファイル。)のリンクを選択します(リンクをクリックすると、ダウンロードが始まります。)。ファイルは200MB程度ありますので、少々時間がかかります。

(2) zipファイルの展開

zipファイルは、exeファイル等をまとめたzip圧縮ファイルになっています。これを完全に展開します。

zipファイルを右クリックして表示されるメニューから「すべてを展開…」を選ぶか、別途ソフトウェアを使用して、zipファイルの中身を完全に展開します(zipファイルをダブルクリックしただけでは、圧縮ファイルの内容が表示されているだけの場合があります。)。

この時に、配置するフォルダの名称は半角の英数または記号とし、日本語等の全角文字を使わないようにしてください(日本語等の全角文字が含まれると起動しないことがあります)。

(3) OCRの起動

ダウンロードファイルの展開後に現れる「ndlocr_lite_gui.exe」ファイル(アルファベットの「O」のアイコン)をダブルクリックしてOCRを起動します。この時、セキュリティの警告画面が表示されることがありますが、そのまま進めてください。 また、初回のみ、画面枠が表示されてから画面の内容が描画されるまで少々時間がかかります。

目安としてPCのメモリに1GB以上空きがないと起動しません。もしなかなか立ち上がらない場合には、Webブラウザ等メモリを大きく消費するアプリケーションを閉じた後に、再度起動(ダブルクリック)してください。

展開後

次のような画面が表示されればOKです。

起動画面

(4)資料のテキスト化(1枚の画像全体をテキスト化する)

[1] 「画像ファイルを処理する」ボタンを押して、表示されるファイル選択画面から、テキスト化したい画像ファイルを選びます。

[2] 「出力先を選択する」ボタンを押して、表示されるフォルダ選択画面から、テキスト化結果の出力先フォルダを選択します。

[3] 「OCR」ボタンを押します。これによりテキスト化が始まります。

[4] テキスト化が終了すると、下部に結果が表示されます。

OCRのテキスト化後のUI

[5] [2]で指定した出力先のフォルダを開くと、テキストデータ等が出力されています。これをメモ帳などのアプリケーションで開いたり、マウス操作で選択してコピー&ペーストすることもできます。

出力されたファイルとテキストデータの中身

(5)資料のテキスト化(フォルダの中の画像をまとめてテキスト化する)

[1] 「フォルダ内の画像を処理する」ボタンを押して、表示されるフォルダ選択画面からテキスト化したい画像の含まれるフォルダを選びます。続いて、上の(4)と同様にテキストの出力先を選択して「OCR」ボタンを押します。

[2] フォルダの中の複数の画像をまとめてテキスト化したときは、「前の画像」「次の画像」でOCR結果のテキストデータをコマ送りできます。

OCRのテキスト化後のUI

(6)出力ファイルの形式選択

「出力形式の選択」ボタンを押すと、出力ファイルの形式を選択できます。ここで選択した形式が、「出力先を選択する」で設定したフォルダに出力されます。

OCRのテキスト化後のUI

出力ファイルのそれぞれの形式の説明は次のとおりです。

  • TXT形式:構造情報を持たない文字列情報のみのテキストデータです。
  • JSON形式:1行の文字列ごとに、文字列を囲む座標情報とその中の文字列のテキストデータがjson形式で格納されています。
  • XML形式:レイアウト情報、座標情報、及び内部の文字列のテキストデータ等がxml形式で格納されています。
  • TEI形式:TEI(Text Encoding Initiative)に準拠した形式のテキストデータです。
  • 透明テキスト付PDF形式:PDFにテキストデータを透明テキストとして埋め込んだ形式です。内部の検索やコピー&ペーストができます。

(7)Crop&OCRモード

 画像ファイル上の任意の範囲を選択してその範囲だけをOCRする機能です。

[1] 「Crop&OCR」ボタンを押すと、画像が表示されます。

Crop&OCR機能

[2]画像上をドラッグアンドドロップすると青い枠で指定された範囲が表示されます。範囲を選択できたら「切り抜きOCR」ボタンを押します。

Crop&OCRモーダル

[3]少し待つとOCR結果が表示されます。

Crop&OCR結果

(8)キャプチャモード

画像ファイルを用意することなしに、今表示しているPC上の画面の任意の範囲を指定してその範囲だけをOCRする機能です。※指定した範囲の画面キャプチャをアプリケーションの内部で撮影することが、名前の由来です。

[1]「キャプチャモード」ボタンを押します。

キャプチャモードボタン

[2]表示される薄い赤色の長方形を、下図左側のようにOCRしたい範囲にドラッグアンドドロップすると、下図右側のモーダル(キャプチャ結果)が表示されるので「OCR実行」ボタンを押します。

キャプチャ結果

[3]少し待つとOCR結果が表示されます

キャプチャOCR結果

(1)から(7)までの使用した資料画像の出典:芥川竜之介 著『傀儡師』,新潮社,1919. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/1904835/1/53 (参照 2026-02-18)

(8)の画像の出典:ウィキペディア(https://ja.wikipedia.org/wiki/国立国会図書館)