次世代デジタルライブラリーにOCRテキストを画像に重ねて表示する機能を追加しました
2022年11月08日
11月1日に、次世代デジタルライブラリーに、デジタル化済み古典籍資料の一部(江戸期以前のくずし字資料等約6万点)のOCR全文テキストデータを追加し、全文検索ができるようにしました。
このたび、古典籍資料等のOCRテキストデータの表示方法として、次世代デジタルライブラリーの画像ビューワで表示する資料画像上に、くずし字等のテキストデータを重ねて表示する機能を追加しました。
OCRテキストデータは次世代システム開発研究室が開発したOCRソフトウェアがAI(機械学習)により資料画像を読み取ったテキストデータですので、必ずしも正確とは限りませんが、資料を判読する際の手がかりとしてご利用いただけます。
使い方
ビューワ右上の「T」のボタン(矩形ごとにテキスト表示)をクリックします。
画像上のOCRテキストデータが存在する領域が赤い枠で表示されるので、テキストを確認したい枠にマウスを重ねると当該領域のOCRテキストデータが表示されます。
OCRテキストデータが表示された状態でマウスをクリックすると、クリップボードにコピーされます。ctrl+Vで貼り付け可能です。