2021年度
「次世代デジタルライブラリー」の全文検索対象を著作権保護期間満了図書資料全件に拡大しました
https://lab.ndl.go.jp/news/2021/2022-01-31/ にてお知らせした全文検索の対象を著作権保護期間の満了した図書資料全件(約28万点)に拡大しました。 今回追加したテキストデータは、令和3年度に当館が実施中のデジタル化資料のOCRテキスト化事業(参考: https://lab.ndl.go.jp/event/digicafe2021/ )の成果物の一部で……
「次世代デジタルライブラリー」全文検索対象拡大及び画像検索機能改善のお知らせ
1.次世代デジタルライブラリーの全文検索対象の拡大 著作権保護期間の満了した図書資料約7万点を全文検索の対象に加えました。 今回追加したテキストデータは、令和3年度に当館が実施中のデジタル化資料のOCRテキスト化事業(参考:……
「次世代デジタルライブラリー」メンテナンスのお知らせ(1/27)
全文テキスト検索対象の拡大及び新機能追加のため、 2022年1月27日朝より次世代デジタルライブラリーのサービスを停止します。 停止期間は1日程度の見通しです。ご迷惑をおかけしますが、何卒ご理解賜りますようお願い申し上げます……
資料画像のタグ推定モデルの公開について
NDLラボ公式GitHub上に、資料画像から自動でタグを推定する機械学習モデルを公開しました。 本モデルは、デジタル化した資料画像から抽出した図版等に、イラスト、地図、グラフ、写真、といったタグを自動で付与する機械学習モデ……
OCR1行データセットの公開について
NDLラボ公式GitHub上に、OCR1行データセットを公開しました。 本データセットは、デジタル化資料から切り出した1行分の画像とテキストとを対応付け、OCR等の学習用データセットとして整備したものです。国立国会図書館デ……
デジタル資料の長期保存に関するアンケート調査の実施について
11月上旬から12月上旬にかけて、国立国会図書館は、デジタル資料の長期保存に関するアンケート調査を実施します。(担当部署:電子情報部電子情報企画課次世代システム開発研究室) 調査は、株式会社未来の図書館研究所(外部サイト)……
2021年度「NDLデジタルライブラリーカフェ」開催のご案内
2021年12月3日(金)に、デジタルライブラリーにかかわる研究や最新動向をもっと身近に、もっと楽しくする講演会を開催します。 今年度のテーマは、「社会科学×情報学×図書館:デジタル化資料からの情報抽出 OCRと関連領域」と……
振り仮名注釈コーパスの公開について
NDLラボ公式GitHub上に、2種類の振り仮名注釈コーパスを公開しました。 このデータセットは、日本語のテキストを分かち書きにした上で、分割した箇所に振り仮名を付与したものです。 青空文庫の公開作品のテキストデータに対し視……
NDL-ImageLabelデータセットの公開について
NDLラボのGitHubから、ラベル付き画像データセットNDL-ImageLabelデータセットを公開しました。 https://github.com/ndl-lab/imagetagdataset(外部サイト) このデータ……
Japan Open Science Summit 2021(JOSS2021)に参加します
「Japan Open Science Summit 2021(JOSS2021)」に参加し、6月17日(木)にセッション「Wikidata×デジタルアーカイブ×LOD―国立国会図書館・東京藝術大学・大阪市立図書館のリソースをつなげてみる―」を開催します。……