Japan Open Science Summit 2021 国立国会図書館主催セッション「Wikidata×デジタルアーカイブ×LOD―国立国会図書館・東京藝術大学・大阪市立図書館のリソースをつなげてみる―」
目次
イベント概要
国立国会図書館は、オープンサイエンスをテーマとした日本最大のカンファレンス「Japan Open Science Summit 2021(JOSS2021)」(6月14日(月)から19日(土)まで)に参加し、6月17日(木)にセッション「Wikidata×デジタルアーカイブ×LOD―国立国会図書館・東京藝術大学・大阪市立図書館のリソースをつなげてみる―」を開催します。
図書館、博物館、文書館等がデータを公開・発信するプラットフォームとして、Wikimedia CommonsやWikidataといったコミュニティベースで運営されるウィキメディア財団の各種プロジェクトが注目されています。また、Europeanaやジャパンサーチなどの公的なメタデータ統合プラットフォームにおいて、メタデータ記述をより豊かにするための情報源としてWikidataやDBpediaが活用される例もあります。本セッションでは、ウィキメディア・プロジェクトでのコンテンツ発信、データ公開の実践者を講師に迎え、国立国会図書館、東京藝術大学及び大阪市立図書館のオープンデータを用いたデータ登録デモを交えつつ、ウィキメディア・プロジェクトと図書館、博物館、文書館とのこれからの関係についてディスカッションを行います。
開催概要
- 日時
- 2021年6月17日(木)15時30分から17時30分まで(15時15分受付開始)
- 開催形態
- オンライン開催(Web会議システム(Cisco Webex Events)を使用)
- 講師(登壇予定順)
- 加藤文彦氏(リンクト・オープン・データ・イニシアティブ理事)
- 嘉村哲郎氏(東京藝術大学芸術情報センター助教)
- 澤谷晃子氏(大阪市立中央図書館利用サービス担当課長代理)
- 募集人数
- 100名程度
- 参加費
- 無料
- 参加申込み締切
- 申込みは締め切りました。
プログラム・講演資料
- 「リンクトデータ、Wikidata、GLAM」[PDF: 11.9 MB]:加藤文彦氏(リンクト・オープン・データ・イニシアティブ理事)
- 「東京藝術大学 音楽学部大学史史料室のデジタルアーカイブ公開とGLAM Wiki」[PDF: 5.24 MB] :嘉村哲郎氏(東京藝術大学芸術情報センター助教)
- 「大阪市立図書館オープンデータの新たな活用の可能性」[PDF: 4.77 MB]:澤谷晃子氏(大阪市立中央図書館利用サービス担当課長代理)
- デモンストレーション「データの公開と利用」
国立国会図書館が公開しているオープンデータをWikidataへ登録し、登録したデータに、Wikimedia Commons等に登録されているオープンデータをリンクして関連付けるまでのデモンストレーションを行う予定です。 - ディスカッション
司会:国立国会図書館電子情報部電子情報流通課長
当日のディスカッション
事前にお寄せいただいた質問と当日お寄せいただいた質問について、ディスカッションでのやりとりをご紹介します。また、イベント中にお答えできなかった内容も合わせて掲載いたします。
質問1:実際に大学のサービスとして実装、提供している例はあるのでしょうか。
- 嘉村氏:日本国内の大学ではWikimedia Commonsを用いて情報を公開した例はあまり無く、東京藝術大学で試してみた状況です。海外ではGLAM-Wikimedia Project(外部サイトへリンク)という位置付けで取り組んでいる大学が、特に欧米の図書館系大学を中心に数多く存在します。個人的な感想になりますが、日本国内ではまだあまり馴染みが無い印象です。
- 加藤氏:大学の実例は分かりませんが、海外の図書館では使われはじめています。ニューヨークの図書館で、Wikibaseというソフトウェアを用いてデジタルアーカイブを公開しているところもあります。
質問2:Wikidataに写真を登録するにはまずWikimedia Commonsに登録することになるのでしょうか。
- 加藤氏:はい。Wikidataに画像をアップロードすることはできないので、画像を使いたい場合はWikimedia Commonsを使うことになります。
- 嘉村氏:Wikidataには画像へのリンク情報を入力することしかできないので、Wikimedia Commonsにデータを入れてWikidataから参照させることになります。
- 澤谷氏:まずはWikimedia Commonsに登録して、使いたい人に使ってもらえると良いと思います。
質問3:現在、国立国会図書館あるいはジャパンサーチにおいて、Wikidataにシステマティックにデータを投入しているケースはあるのでしょうか。
- 国立国会図書館:現在、国立国会図書館からシステマティックにデータは投入しておりません。今後検討したいと考えています。国立国会図書館が公開しているオープンデータを使って、第三者が個別に登録されている例はあり、講演の中でご紹介いただいたとおり、Web NDL Authoritiesやジャパンサーチにおける名称IDを入れるWikidataプロパティがすでに作られています。
- 嘉村氏:ヨーロッパを中心に、国立図書館がWikimedia Commonsに登録している例があります。例えばスイス国立図書館はかなりの数のデータを登録しています。ぜひ国立国会図書館でも前向きに検討してもらいたいです。
質問4:Wikidataはパブリックドメインですが、登録時の著作権としてパブリックドメインを改めて指定する必要があるのですか。
- 加藤氏:Wikidataの立場からの話になりますが、基本的にはそのとおりです。Wikidataに登録されたデータは基本的にCC0として扱われるので、元のデータに別のライセンスが適用されている場合は、元データの公開者にCC0として登録してよいか確認して同意を得る必要があります。Wikidataは、ある情報源に基づいて、ある人がある曲の歌手であることを確認し、データとして記入することに著作権が発生しないという立場を取っています。Wikidataはそうしたデータの集積であり、Wikidataの編集者は、入力したデータがCC0として扱われることに同意しているという扱いになります。バルクでデータセットを上げる時に、パブリックドメインではないものが含まれていないかを注意する必要があります。Wikidataは多くの人が編集を行うので、データを入れる時にCC0にすることで二次利用がしやすいようにしています。
質問5:オープンライセンスでデータを公開するにあたり、著作権処理はどのようにされたのですか。
- 嘉村氏:山田耕筰の作品の著作権は2016年に切れており、東京藝術大学がWikimedia Commonsにアップロードした自伝の画像データは、パブリックドメインに属しています。そのため、山田耕筰の自筆原稿のスキャンを行った大学史史料室が、画像データ自体の権利を主張することは何か違うのではないかという点で、自由に使っていただけるCC0のライセンスを付与しています。また、今回のWikimedia Commonsへの画像登録は、権利処理を行ったというより、元々パブリックドメインのものを前提にした資料を選択しました。ただ、著作権が切れた資料であっても著者のご遺族と調整が必要になる場面はあります。そういった調整を積み重ねた上でパブリックドメインという扱いになっているということが、一つの答えになると思います。
- 澤谷氏:考え方は嘉村さんとほとんど同じです。大阪市立図書館の場合は、公開するにあたり職員が全ての画像について再確認を行いました。著作権は切れていても、家分け文書と呼ばれる、個人の家から出てきた文書類や、現住所が分かってしまう資料など、個人情報の観点から懸念があるものを除き、まとまった形で点検を行い、確認ができたものについて公開しました。
質問6:デジタルアーカイブを公開している機関は、WikidataやWikimedia Commonsとどのように関わっていけば良いでしょうか。
- 澤谷氏:システムやデータに詳しくない場合でも、話題にすれば詳しい人が助けてくれるので、できることに取り組んでいければよいと思います。そうすれば敷居が低くなり、市民にももっと使ってもらいやすくなるのではないでしょうか。活用してもらうのが、図書館が資料を提供する使命だと思うので、できれば続けていきたいと思います。
- 嘉村氏:規模が小さい機関でも、Wikidataを使用することで、所蔵資料が検索対象となり、APIやツールを利用したデータ活用の幅が広がることが期待できると思います。ウェブで画像を公開するだけでなく、こうした情報が構造化されたデータベースに載せることによって、いろいろな使われ方が出てくるのではないでしょうか。また、画像データをWikimedia Commonsに登録しておくことは、データのバックアップとして利用できるという側面もあります。
- 加藤氏:Wikidata側からすると、いろいろなデータを提供してもらえるのはありがたいです。書誌データや典拠データについては、図書館や博物館が多く管理しており、そうしたデータがWikidataにより多く登録されれば、他のデータとつながり、逆にWikidata側から図書館や博物館側への流れもでき、閲覧される機会を増やすことができるといったメリットも生じると思います。
質問7:Wikimedia CommonsやWikidataでのデータ公開について、機関内部での評判、評価などがあれば教えてください。
- 澤谷氏:やればやるほどアクセス数が増えるというのが数字に表れます。また、Wikipediaなどにデータが搭載されると、より一層見てもらえるということもあり職員からも評価されています。
- 嘉村氏:今回登録したデータは、大学内で大きく宣伝しているわけではないですが、今後いろいろなものを登録して外部のデータとつなげられると良いなと考えています。海外の美術館では、Wikidata上の材質や技法といった典拠データと自館のコレクションのデータをマッチングさせることによってWikidata側から館のコレクションにアクセスされて、新たな発見や知識の獲得が起こることがあります。このようにWikidata上に公開されたデータを典拠データとして使うという形も増えてきているので、今後うまく活用できればよいと思います。
質問8:大阪市史編纂所の古文書を中心とする史料類が「大阪市立図書館デジタルアーカイブ」の収録対象になることはありませんか。
- 澤谷氏:現在のところは大阪市立図書館の所蔵資料のみを対象としています。大阪市史編纂所とは資料を別で管理しているため、今のところはありません。また、他機関が作成しているデータベース等についても、「大阪市立図書館デジタルアーカイブ」との関連はありません。
質問9:国立国会図書館からインターネット公開(保護期間満了)として提供されているIIIFマニフェストのリンク等を、第三者がWikidataに登録しても良いのでしょうか。
- 国立国会図書館:国立国会図書館デジタルコレクションサイトへのリンク(マニフェストURIを含む)は自由に張っていただいて構いません。
質問10:CiNii Researchとも将来的に連携されるのでしょうか。
- 国立国会図書館:国立国会図書館サーチと連携済のデータベースとの関係性に考慮の上、連携を検討していく予定です。
参考情報
- Japan Open Science Summit 2021(外部サイトへリンク)
- 個人発表セッション(外部サイトへリンク):国立国会図書館職員が登壇し、電子情報部電子情報企画課次世代システム開発研究室における調査研究の成果について紹介します。
- 過去のイベント
お問い合わせ先
国立国会図書館 電子情報部 電子情報流通課 標準化推進係
メールアドレス:opendata(at)ndl.go.jp ※(at)は半角記号の@に置き換えてください。
電話:03-3581-2331(内線:40230)