ホーム > データ（活用する） > NDLOCR-Liteの使い方

NDLOCR-Liteの使い方

NDLラボでは、マウス操作だけで簡単に利用できるOCRソフトウェア「NDLOCR-Lite」を開発・公開しています。

このソフトウェアを利用し、図書や雑誌資料の画像から文字部分をテキスト化（文字起し）することができます（機械的な判断結果のため、誤りを含みます。）。

このページではWindowsユーザを対象に、簡単な使い方をご紹介します。

なお、Macユーザに向けての使い方については、当館非常勤調査員でもある東京大学史料編纂所の中村覚先生の記事「NDL古典籍OCR-Lite（ndlkotenocr-lite）をMac OSで使用する（https://zenn.dev/nakamura196/articles/c62a465537ff20 ）」が参考になります。

（1） OCRのダウンロード

次が、ダウンロードサイトのURLです、リンクをたどってブラウザで表示してください。

https://github.com/ndl-lab/ndlocr-lite/releases

ダウンロード画面

上のような画面が表示されます（バージョン番号（上の画像の場合は「v1.0.0」）は更新されている可能性があります。）。

ここでは、OSごとにダウンロードファイルを用意しています。利用したいOSのファイル（ファイル名に「windows」を含むzipファイル。）のリンクを選択します（リンクをクリックすると、ダウンロードが始まります。）。ファイルは200MB程度ありますので、少々時間がかかります。

（2） zipファイルの展開

zipファイルは、exeファイル等をまとめたzip圧縮ファイルになっています。これを完全に展開します。

zipファイルを右クリックして表示されるメニューから「すべてを展開…」を選ぶか、別途ソフトウェアを使用して、zipファイルの中身を完全に展開します（zipファイルをダブルクリックしただけでは、圧縮ファイルの内容が表示されているだけの場合があります。）。

この時に、配置するフォルダの名称は半角の英数または記号とし、日本語等の全角文字を使わないようにしてください（日本語等の全角文字が含まれると起動しないことがあります）。

（3） OCRの起動

ダウンロードファイルの展開後に現れる「ndlocr_lite_gui.exe」ファイル（アルファベットの「O」のアイコン）をダブルクリックしてOCRを起動します。この時、セキュリティの警告画面が表示されることがありますが、そのまま進めてください。また、初回のみ、画面枠が表示されてから画面の内容が描画されるまで少々時間がかかります。

目安としてPCのメモリに1GB以上空きがないと起動しません。もしなかなか立ち上がらない場合には、Webブラウザ等メモリを大きく消費するアプリケーションを閉じた後に、再度起動（ダブルクリック）してください。

展開後