2023年度

データ
2024年02月07日

NDL古典籍OCR ver.3の公開及び次世代デジタルライブラリー搭載古典籍資料のテキストデータの差替えについて

1. NDL古典籍OCR ver.3のソースコード等の公開について NDLラボ公式GitHub(外部サイト)から、NDL古典籍OCR ver.3を公開しました。 NDL古典籍OCRは、古典籍資料のデジタル化画像から全文テキストデータ……
データ
2024年02月07日

青空文庫振り仮名注釈付き音声コーパスの公開について

NDLラボ公式GitHub上に、青空文庫振り仮名注釈付き音声コーパスを公開しました。 このデータセットは、 青空文庫で公開されている著作権保護期間が満了した作品のテキストデータと、視覚障害者情報総合ネットワーク「サピエ」(社……
データ
2023年12月05日

次世代デジタルライブラリーへの新機能(表の構造化)の追加及び新機能のソースコード及びデータセットの公開について

実験サービス次世代デジタルライブラリーにおいて、 資料画像に含まれる表から表形式の構造化テキストデータを作成する新機能を追加しました。 また、新機能実現のためのプログラムのソースコード及び開発時に作成したデータセットを公開し……
データ
2023年09月19日

次世代デジタルライブラリーのAPIを紹介するページ等の公開について

1. 次世代デジタルライブラリーのAPIの概要及び利用方法を紹介するページの公開 次世代デジタルライブラリーの収録資料(国立国会図書館デジタルコレクションでインターネット公開をしている著作権保護期間満了のデジタル化済み図書28……
データ
2023年08月08日

NDL古典籍OCR ver.2の公開について

NDLラボ公式GitHub(外部サイト)から、「NDL古典籍OCR」のver.2を公開しました。 NDL古典籍OCRは、古典籍資料のデジタル化画像から全文テキストデータを作成する目的で、国立国会図書館が実験的に開発している……
データ
2023年07月12日

NDLOCR ver.2の公開について

NDLラボ公式GitHubから、OCR処理プログラム「NDLOCR」のver.2を公開しました。 NDLOCRは、国立国会図書館(以下「当館」といいます。)がデジタル化した資料から、全文テキストデータを作成することを目的に……