お知らせ一覧
最新10件のみ表示しています。
次世代デジタルライブラリーへの「テキストモード」の追加について
次世代デジタルライブラリーに「テキストモード」を追加しました。 このモードは次世代デジタルライブラリーにおいて、デジタル化画像の代わりに、読み順を整序した全文テキストデータを横書きで表示するものです。これにより、通常のウェ……
次世代デジタルライブラリーAPIからの構造化テキストデータの提供について
これまで、著作権保護期間が満了した図書資料約28万点のOCRテキストデータについて、次世代デジタルライブラリーからダウンロード機能を提供してきましたが、 この度、データの利便性の改善を図るため、従来の形式にくわえて、段落や……
帝国議会会議録発言数ビューアの公開について
実験サービス帝国議会会議録発言数ビューアを公開しました。 このサービスは、「帝国議会会議録検索システム」(2025年3月3日時点)収録のテキストデータを活用した実験サービスであり、入力された検索条件に当てはまる帝国議会会議……
青空文庫振り仮名注釈付き音声コーパスver.2の公開について
NDLラボ公式GitHub上に、青空文庫振り仮名注釈付き音声コーパスver.2を公開しました。 このデータセットは、 青空文庫で公開されている著作権保護期間が満了した作品のテキストデータと、視覚障害者情報総合ネットワーク「サ……
NDL古典籍OCR-Liteの公開について
NDL古典籍OCR-Liteの公開について NDLラボ公式GitHub(外部サイト)から、NDL古典籍OCR-Liteを公開しました。 NDL古典籍OCR-Liteは、ノートパソコン等の一般的な家庭用コンピュータやOS環境で……
NDL古典籍OCR ver.3の公開及び次世代デジタルライブラリー搭載古典籍資料のテキストデータの差替えについて
1. NDL古典籍OCR ver.3のソースコード等の公開について NDLラボ公式GitHub(外部サイト)から、NDL古典籍OCR ver.3を公開しました。 NDL古典籍OCRは、古典籍資料のデジタル化画像から全文テキストデータ……
青空文庫振り仮名注釈付き音声コーパスの公開について
NDLラボ公式GitHub上に、青空文庫振り仮名注釈付き音声コーパスを公開しました。 このデータセットは、 青空文庫で公開されている著作権保護期間が満了した作品のテキストデータと、視覚障害者情報総合ネットワーク「サピエ」(社……
次世代デジタルライブラリーへの新機能(表の構造化)の追加及び新機能のソースコード及びデータセットの公開について
実験サービス次世代デジタルライブラリーにおいて、 資料画像に含まれる表から表形式の構造化テキストデータを作成する新機能を追加しました。 また、新機能実現のためのプログラムのソースコード及び開発時に作成したデータセットを公開し……
次世代デジタルライブラリーのAPIを紹介するページ等の公開について
1. 次世代デジタルライブラリーのAPIの概要及び利用方法を紹介するページの公開 次世代デジタルライブラリーの収録資料(国立国会図書館デジタルコレクションでインターネット公開をしている著作権保護期間満了のデジタル化済み図書28……
NDL古典籍OCR ver.2の公開について
NDLラボ公式GitHub(外部サイト)から、「NDL古典籍OCR」のver.2を公開しました。 NDL古典籍OCRは、古典籍資料のデジタル化画像から全文テキストデータを作成する目的で、国立国会図書館が実験的に開発している……