ホーム > サービス(体験する) > 次世代デジタルライブラリー

次世代デジタルライブラリー

サービスURL

ソースコード

概要

次世代デジタルライブラリーは、国立国会図書館次世代システム開発研究室での研究を基に開発した機能を実装した実験的な検索サービスです。全文テキスト検索機能や機械学習を用いた自動処理、International Image Interoperability Framework(IIIF) API等の技術的有効性を検証することを目的としています。

検索対象は「国立国会図書館デジタルコレクション」でインターネット公開をしている著作権保護期間満了となった図書及び古典籍のデジタル化資料(約33万6千点)です。

「全文から検索する」では全文テキストからの検索ができます。 令和4年3月現在の対象資料は、令和3年度デジタル化資料のOCRテキスト化事業の成果物を利用した図書資料28万点分です。

「画像から検索する」では図書及び古典籍資料から自動的に抽出された画像・図版の中から、似たものを探すことができます。

なお、動作確認は最新のChrome及びFirefoxで行っており、Internet Exploreでは動作しません。

提供している機能には、1. 全文テキスト検索、2. 図版の自動切り出しを利用した画像検索、3. 提供資料の背景白色化、4. 資料の目次自動生成、5. スマートフォン表示のための自動画像加工、6.ページめくり方向の自動判定、7. IIIFの活用、8. 画像認識を利用した切り出された図版の内容に関連するタグ付与・絞り込み検索、があります。詳しくは「NDLラボ関係文献リスト」に掲載の文献をご覧ください。

また、関連するプログラムや機械学習に利用した学習用データセットをGitHub (https://github.com/ndl-lab) から公開しています。

ご利用に当たって

画面キャプチャ及び検索結果の複製利用については、申請不要で自由にご利用になれます。また、APIの利用については、営利目的かつ継続的な利用を除き、申請不要で自由にご利用になれます。その他の利用に関しては、問い合わせまで。