次世代デジタルライブラリーにOCRテキストを画像に重ねて表示する機能を追加しました 

2022年11月08日

11月1日に、次世代デジタルライブラリーに、デジタル化済み古典籍資料の一部(江戸期以前のくずし字資料等約6万点)のOCR全文テキストデータを追加し、全文検索ができるようにしました

このたび、古典籍資料等のOCRテキストデータの表示方法として、次世代デジタルライブラリーの画像ビューワで表示する資料画像上に、くずし字等のテキストデータを重ねて表示する機能を追加しました。

OCRテキストデータは次世代システム開発研究室が開発したOCRソフトウェアがAI(機械学習)により資料画像を読み取ったテキストデータですので、必ずしも正確とは限りませんが、資料を判読する際の手がかりとしてご利用いただけます。

使い方

  1. ビューワ右上の「T」のボタン(矩形ごとにテキスト表示)をクリックします。 矩形表示ボタン

  2. 画像上のOCRテキストデータが存在する領域が赤い枠で表示されるので、テキストを確認したい枠にマウスを重ねると当該領域のOCRテキストデータが表示されます。 矩形表示ボタンオン

  3. OCRテキストデータが表示された状態でマウスをクリックすると、クリップボードにコピーされます。ctrl+Vで貼り付け可能です。