データ(活用する)
当館が提供しているデータや、参考になる技術情報をまとめてあります。
GitHubについて
2019年8月にGitHubにNDLラボのアカウントを開設し、学習用データセットや各種プログラムを公開しています。
令和3年度OCR関連事業について
事業の成果物であるOCR処理プログラムやOCR学習用データセットを公開しています。
古典籍資料のOCRテキスト化実験(令和4年度~)
令和4年度以降、国立国会図書館は、令和3年度OCR処理プログラム研究開発等で得た知見を生かし、古典籍資料を対象としたOCR処理プログラムの研究開発とテキスト化実験を実施しています。
Experimental OCR conversion of rare books and old materials (since 2022)
We have been developing an in-house OCR processing program for pre-modern materials (NDLkotenOCR) and conducting experiments in converting those materials to text data since FY2022, utilizing the knowledge gained through the Development of Japanese OCR software project (FY2021) and Additional development of Japanese OCR software project (FY2022).
GitHubアカウント以外から提供しているデータセット
GitHubアカウント以外から提供しているデータセットについての情報(概要、API取得の可否など)を提供しています。
利活用テンプレート
国立国会図書館のデータを利活用するアプリケーションを作成するためのテンプレートやチュートリアルを掲載しています。
データ活用例の紹介
NDLが提供する各種データの活用例(アプリ・ウェブサービス等)や、データ利活用イベントへの協力事例他機関 が主催するイベントにおけるNDLの発表資料等を紹介します。