オープンデータの利用と図書館の役割

最近,「オープンデータ」という言葉をよく聞く。図書館界隈では,この言葉は研究データの文脈であったり,デジタルアーカイブの文脈であったり,さらには政府情報公開の文脈で語られる。ここではこのうち,政府情報公開の文脈で整理するとともに,図書館との関連についても触れたい。政府のオープンデータは,海外では,オープン・ガバメント・データ(OGD)と呼ばれているが,ここでは,日本で一般的な呼び方である「オープンデータ」を用いる。オープンデータの定義や目的はいろいろあるが,公式的なものとしてはそれぞれ高度情報通信ネットワーク社会推進戦略本部(IT総合戦略本部)の「オープンデータ基本方針」(2017年)や,同じく「電子行政オープンデータ戦略」(2012)などが詳しい。本稿ではそれらを改めて議論することはしない。

日本では,オープンデータの議論,情報は法令,制度,政府による取組状況に関わるものが多い。ウェブをみても,あるいはCiNii Researchでも,そうした議論,情報は充実している。しかし,利用の実態や利用する側からの情報はあまり見られない。オープンデータは利用されているのか,必要とされているのか,実際に社会的に影響を与えているのか。こうした利用や効果の議論は少ないのが現状であるが,このことは,海外でも同様のようである。

ここでは,オランダ,ユトレヒト大学のSafarov等(2017)の文献から,英語文献のオープンデータの議論を確認するとともに,図書館への示唆を考えてみたい。Safarov等の文献は,Web of Scienceの引用回数が100件であり(2022年7月27日現在),オープンデータの文献としては比較的多く引用されている。Safarov等はオープンデータに関する文献,101件の体系的なレビューを行い,「OGD活用フレームワーク」(以下,単に「フレームワーク」)を導出している。対象とした文献はScopusやWeb of Scienceなどから「オープンガバメント」「オープンデータ」などの語を用いて検索したものである。検索結果からオープンサイエンスなどの文献は除外し,政府のオープンデータのみを対象としている。

文献のレビューから導出されたフレームワークは,サブカテゴリを含む4つのカテゴリから構成される。カテゴリ相互に線が引かれ,関係も整理されている。以下では主に,カテゴリ,サブカテゴリ及びその要素をまとめていく。このフレームワークを理解する上で重要なこととして,著者等はフレームワークで示されている「効果」はポジティブなものが多かったものの,「実証された」ものではなく未だ仮定,仮説に過ぎないものが多いと述べている。このように経験的知識が不足している点は日本と同様であろう。

出典:Safarov, Igbal, Albert Meijer, and Stephan Grimmelikhuijsen. “Utilization of open government data: A systematic literature review of types, conditions, effects and users.” Information Polity 22.1 (2017): 1-24.

フレームワークは4つのカテゴリで構成されており,1つ目が「活用型」(Types)であり,どのように利用するか,活用するか,である。2つ目が「効果」(Effects)であり,どのような社会的な効果を持つか,である。3つ目は「条件」(Conditions)であり,「活用型」や「効果」に影響を与える条件である。4つ目が「利用者」(Users)である。「活用型」は「利用者」の利用形態を表しており,条件によって態様が変化する。また,「活用型」と「効果」は因果の関係にあり,活用の仕方によって効果が変化することを表している。以下,個別のカテゴリについて述べていく。

最初の「活用型」であるが,これは「分析活用型」と「統合型活用型」に分けられる。「分析活用型」は,主に対象世界の特徴やその理解,政府の特定の問題を解決したりするためにオープンデータを用いるものである。具体的にはデータ分析,反腐敗,意思決定,研究などを含む。「統合型」(synthetic)は,なんらかの機能的な目的のためにオープンデータを用いるもので,イノベーション,スマートシティー,新しいサービス,ハッカソンを含む。多少,サブカテゴリの分類が分かりにくいが,前者が分析を,後者がツール,アプリ開発などを中心としているようである。これらのうち,イノベーションはもっとも多くの文献にあらわれており,経済的価値を生み出すビジネス主導のイノベーションなどが多く論じられているという。

つぎに「効果」であるが,これは大きく3つに分かれる。「社会的効果」「経済的効果」「グッドガバナンス」(good governance)である。「社会的効果」は,オープンデータ利用により生まれる社会的効果であり,「経済的効果」は,オープンデータ活用による経済発展,効率性向上などである。「グッドガバナンス」は,オープンデータ活用による政府の透明性と説明責任向上,市民の信頼向上などである。文献で効果が示されることは多くない上,あまり実証もされていないという。その中でも最も多く文献で言及されていたのが透明性と説明責任向上であり,経済的効果,市民の参加が続く。

「条件」については大きく2つに分けることができる。「技術的条件」と「社会的条件」である。「技術的条件」はデータの質,入手可能性,利用するためのインフラなどを指す。 「社会的条件」は法律や政策などの制度を指す。先述したようにこれが,活用型や効果に影響を与える。データの質がよければ,「効果」に影響を与えることは容易に想像できよう。「技術的条件」には,データの質,利用可能性,インフラなどが,「社会的条件」には利用する側のスキル,法令・政策,プライバシーなどが含まれる。この中で文献中,最も多く言及されているのがデータの質であり,以下,法令・政策,スキルと続く。

Safarov等の文献からはなれるが,「条件」については日本語の文献,情報も多い。「技術的な条件」は,特に政府よる積極的な関与が見られる。共通語彙基盤,推奨データセット,カタログサイトなどデータ公開方法,ライセンス方式の推奨,ティム・バーナーズ=リーの5つ星スキームなど詳細に示されている。「社会的条件」についても「電子行政オープンデータ戦略」に始まる政府の取り組み,「官民データ活用推進基本法」など法令による自治体計画策定の義務付け,努力義務化,「地方公共団体オープンデータ推進ガイドライン」による標準化など充実している。これらは自治体の取り組みの足並みを揃える効果を持つ。

Safarov等の文献に戻り,最後が利用者である。利用者は大きく「直接的利用者」と「間接的利用者」に分けることができる。前者はオープンデータを自ら利用する利用者で,専門的な知識や強い関心を持つ。後者は,何らかの形で加工されたオープンデータを利用する利用者である。アプリが開発されたとしたら,そのアプリの利用者ということになる。具体的な利用者としては,市民,開発者,ビジネスユーザー,ジャーナリスト,研究者,NGOなどがあり,市民が最も多くの文献で触れられているという。

文献ではこれらの整理のあとに今後の研究の方向性が示されており,特に,利用形態や効果は経験的な知識が十分でないことから研究の必要性を指摘している。ただし,そうした研究は実際には困難であることも指摘されている。このことは,図書館評価において,インプット,アウトプットは容易に把握できても,アウトカム,インパクトの情報を入手し,評価することは容易でないことからよく理解できることである。

さて,以上のSafarov等の文献では,利用や効果について十分な経験的知識がないこと,つまり実証研究が行われていないことが指摘されていたが,利用や効果の検証が十分でないのは,実践面でも同様ではないだろうか。仮にそうだとすると,オープンデータ公開の理念と実態の乖離は,いつの間にか大きくなることも危惧される。このことを考えると,オープンデータと利用者をつなぐ結節点となる役割の機関が不可欠ではないだろうか。そうした役割を担うのに適任なのが図書館である。公立図書館は全国に3,300館あり,多くの市民が利用している。そして,図書館はこれまでも,図書館法の「公の出版物の収集」に関する規定(第9条)に基づいて政府,自治体の情報を「地域資料」のひとつとして収集,提供してきた。機関数,制度的正当性以外にも図書館が適任である理由がある。

図書館が適任であるのは,大学図書館を中心に,①機関所属の研究者の論文などを電子的に提供する機関リポジトリを運用してきたこと,②研究データ管理(RDM)への取り組みを開始していること,③データライグラリアン,データキュレイターの人材育成の議論を始めていること,などを挙げられる。館種は異なるとはいえ,図書館界全体として状況を共有している。また,公立図書館では,④PDFなどデジタル行政資料の収集・保存に乗り出している自治体のあること(例えば埼玉県),⑤利用者と身近なところにあり,そのニーズを把握し,必要に応じて提供,提示してきたこと,などを挙げられる(例えばカナダのトロント公共図書館ではハッカソンを実施している)。また,⑥図書館の専門的職員はメタデータ付与のトレーニングを受けていることから,提供以外にも組織化(メタデータ付与)にも関わることができる。以上を踏まえると,オープンデータの収集,メタデータ付与,提供,保管などで公立図書館が関わることは,オープンデータを広く伝えるためにも必要なことではないだろうか。

Safarov, Igbal, Albert Meijer, and Stephan Grimmelikhuijsen. “Utilization of open government data: A systematic literature review of types, conditions, effects and users.” Information Polity 22.1 (2017): 1-24.