2022年度

サービス
2023年01月24日

次世代デジタルライブラリーへの古典籍資料のテキストデータ投入完了及び「NDL古典籍OCR」のソースコード等の公開について

1. 次世代デジタルライブラリーへの古典籍資料テキストデータ投入完了について 2022年11月に実験サービス「次世代デジタルライブラリー」の全文検索対象を古典籍資料にも拡大し、以後順次テキストデータの投入を継続していましたが、……
イベント
2023年01月20日

「ジャパンサーチAPIハッカソン ―ミュージアム、図書館、地域で使えるサービスを作ろう!―」開催のお知らせ

2023年2月11日(土・祝)・19日(日)、参加型イベント「ジャパンサーチAPIハッカソン―ミュージアム、図書館、地域で使えるサービスを作ろう!―」を開催します。ジャパンサーチのAPIを使ったデータの利活用に関心のある……
サービス
2023年01月10日

NDL Ngram Viewerの対象範囲の拡大及びソースコード・データセットの追加公開について

1. NDL Ngram Viewerの対象範囲の拡大について 2022年5月に公開した実験サービス「NDL Ngram Viewer 」について、この度大幅に対象資料の範囲を拡大しました。 NDL Ngram Viewerは、全文テキストデータに含まれる単語・フレーズについて、キー……
イベント
2022年12月14日

2022年度「NDLデジタルライブラリーカフェ」開催のご案内

2023年1月18日(水)に、デジタルライブラリーにかかわる研究や最新動向をもっと身近に、もっと楽しくするオンラインイベントを開催します。 今年度のテーマは、「NDLOCRを使ってみた―全文テキスト活用のススメ―」となって……
イベント
2022年12月12日

第24回図書館総合展で主催したフォーラムの録画と概要を公開しました

2022年11月1日に実施した第24回図書館総合展の当館主催フォーラム「#NDL全文使ってみた~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」について、第一部の録画と第二部の概要報告をイベントページに掲載しま……
データ
2022年12月09日

NDL Ngram Viewerのソースコードとngramのデータセットを公開しました

2022年5月にNDLラボの実験サービスとして公開したNDL Ngram Viewer のソースコードとデータセットを公開しました。 これらを組み合わせることで自由にngram viewerを構築することができます。 (1) ソースコード NDL Ngram Viewerの……
サービス
2022年11月08日

次世代デジタルライブラリーにOCRテキストを画像に重ねて表示する機能を追加しました 

11月1日に、次世代デジタルライブラリーに、デジタル化済み古典籍資料の一部(江戸期以前のくずし字資料等約6万点)のOCR全文テキストデータを追加し、全文検索ができるようにしました。 このたび、古典籍資料等のOCRテキストデ……
サービス
2022年11月01日

2022年11月1日 「次世代デジタルライブラリー」の全文検索対象を古典籍資料にも拡大しました

このたび、「次世代デジタルライブラリー」に、デジタル化済み古典籍資料の一部(江戸期以前のくずし字資料等約6万点)のOCR全文テキストデータを追加し、全文検索できるようにしました。 今回追加したOCR全文テキストデータは、国……
サービス
2022年10月17日

次世代デジタルライブラリーの全文検索機能の改善を実施しました

1.全文テキストデータの差し替え 次世代デジタルライブラリーに搭載している全文テキストデータについて、読み順の自動整序処理を行い、多段組資料等についても可能な限り読み順を補正したテキストデータへと差し替えを行いました。 本改……
イベント
2022年10月05日

第24回図書館総合展でフォーラムを開催します

国立国会図書館は「第24回図書館総合展」に参加し、11月1日(火)にフォーラム「#NDL全文使ってみた~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」を開催します。 詳細は、「第24回図書館総合展 国立国会図書館……
イベント
2022年07月27日

Japan Open Science Summit 2022(JOSS2022)で主催したアイデアソンの録画と概要を公開しました

今年6月にJapan Open Science Summit 2022(JOSS2022)で当館が主催した「国立国会図書館デジタル化資料データ(画像・テキスト)の使い道:90分アイデアソン」セッションについて、イベントページに当日の成果の概要とイベントの録……
サービス
2022年06月01日

次世代デジタルライブラリーの詳細検索機能追加について

次世代デジタルライブラリーに、日本十進分類法(NDC9版)による絞り込み検索機能を追加しました。 全文検索画面から詳細検索を有効にすることで、第1次区分から第3次区分までを横断した、OR検索が可能です。 ただし、書誌データに……
サービス
2022年05月31日

NDL Ngram Viewerの公開及びOCR学習用データセットの公開について

NDL Ngram Viewerの公開について 国立国会図書館が提供するデジタル化資料のOCRテキスト化事業の成果物である全文テキストを活用した実験サービスとして、 キーワードの出版年代毎の出現頻度の可視化及び比較が可能なNgram View……
データ
2022年05月30日

令和3年度OCR関連事業の概要ページを公開しました

令和2年度補正予算(第3号)により、令和3年度に国立国会図書館が実施した、OCR関連事業の概要ページを公開しました。 「デジタル化資料のOCRテキスト化」及び「OCR処理プログラム研究開発」の2つの事業について、目的や実施……
イベント
2022年05月20日

Japan Open Science Summit 2022(JOSS2022)でセッションを開催します

「Japan Open Science Summit 2022(JOSS2022)」に参加し、6月10日(金)にセッション「国立国会図書館デジタル化資料データ(画像・テキスト)の使い道:90分アイデアソン」を開催します。 アイデアソン参加を希望する方はフォー……
サービス
2022年04月28日

次世代デジタルライブラリーの機能追加について

次世代デジタルライブラリーに、OCRテキストデータの引用に便利なコピー&ペースト機能を追加しました。 全文テキストデータの表示機能 ビューワ画面上右上の下図赤矢印で示したボタンをクリックすると、当該コマのOCR全文テ……
データ
2022年04月25日

OCR処理プログラム及び学習用データセットの公開について

NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズ……