オープンデータ

【修正されました】埼玉県の「オープンデータ」がいろんな意味で凄い!

【追記】2015/7/13 12:00
利用規約が見直され、改めてオープンデータとして公開されたそうです。

7月7日に掲載しました「広報情報データの利用申請」につきましては、県民の皆様・関係機関からのご要望、ご指摘を踏まえ、利用申請等なしに誰もが本データを利用できる方式に変更いたしました。広報情報データのご利用の際は、以下の利用条件に従ってご利用ください。

広報情報データの利用について – 埼玉県

クリエイティブコモンズライセンスにおけるCC-BYで提供されることになりました。

今回の件に関する私の見解は以下記事に記載しました。

オープンでないものはオープンデータではない。 


 
【追記】2015/7/9 19:00
いったん公開をとりやめることになったようです。


 

【元記事】

「オープンとはなんぞや?」という哲学的な問いすら浮かぶ事例をみかけたので記事にしてみた。

オープンデータ

おさらい

Open Definitionによる「オープンデータ」の定義は以下である。

オープンデータとは、自由に使えて再利用もでき、かつ誰でも再配布できるようなデータのことだ。従うべき決まりは、せいぜい「作者のクレジットを残す」あるいは「同じ条件で配布する」程度である。

  • 利用できる、そしてアクセスできるデータ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。
  • 再利用と再配布ができる データを提供するにあたって、再利用や再配布を許可しなければならない。また、他のデータセットと組み合わせて使うことも許可しなければならない。
  • 誰でも使える 誰もが利用、再利用、再配布をできなければならない。データの使い道、人種、所属団体などによる差別をしてはいけない。たとえば「非営利目的での利用に限る」などという制限をすると商用での利用を制限してしまうし「教育目的での利用に限る」などの制限も許されない。

ちなみに、ありがちな勘違いとして「すべてをオープンにするなんて無理だ! 危なすぎる!」というものがあるが、基本的には「差支えないデータをオープンにしましょう」という話である。

埼玉県のオープンデータ

上記オープンデータの定義を踏まえた上でで、平成27年7月7日より提供開始された埼玉県のオープンデータを見てみよう。

県の広報情報をオープンデータとして民間企業へ提供開始! – 埼玉県
(利用規約が見直されました)

「詳細を見る」のリンク先に書かれている利用規約等がいままでのオープンデータの概念を覆すような革新的な内容になっているので一部要約して紹介する。

・利用申請書を書いて提出する必要がある。
 自由にダウンロードできる……ってわけではないらしい。

・利用申請可能な機関・団体が限られている。
 下記以外ではそもそも利用できない。

  • 公共機関
  • 埼玉県と包括連携協定を締結している団体
  • その他、公共性の高い事業を展開している事業者及び公共性のある目的で広報情報データを利用する事業者

・利用条件がめっちゃ厳しい。
 「埼玉県広報情報データ利用規約」の中に16項目に及ぶ利用条件が記載されている。
 以下はその一部。

(1)利用者は提供された広報情報について、当該情報の広報の目的のみに利用すること。
(2)取得時に必要となる ID、パスワードについては厳重に管理すること。
(3)取得した広報情報データの全部または一部を申請内容以外の方法で第三者へ提供しないこと。
(4)広報情報データをもとに作成された記事の全部または一部について、県の指示があったときは指示に従って掲載内容の変更または掲載の停止を行うこと。
(5)広報情報データの各項目は、記事単位で利用すること。他記事のデータと入れ替えて掲載するなどしないこと。(例:画像を別の記事の画像と入れ替えるなど)
(6)利用する記事については「タイトル」を必ず表示すること。それ以外の項目についての利用は任意とするが、県が別途指定する要素については一部掲載ができないものもある。
(7)記事の各項目を改変して掲載しないこと。ただし、タイトル、概要文の掲載に際して、文字数の制限等が発生する場合の対応については、申請時に埼玉県へ協議し当該対応方法について事前に承認を得ること。

・承認が取り消される。
 利用条件を満たさない場合は承認が取り消される。

利用条件を満たさない利用が発覚した場合や閲覧者に誤解を与える利用が見受けられると埼玉県が判断した場合は、予告なくデータ利用者アカウントを削除するとともに、広報情報データの利用の承認を取り消す。

そこらへんの公開データより、よっぽど厳しいオープンデータである。

総括

もともと人によって「オープンデータ」という言葉の定義には微妙に揺らぎがあるし、自分なんかは「データへのアクセスの自由」と「利用の自由」こそがもっとも重要だと考えているので、ティム・バーナーズ=リーの提唱する「5つ星オープンデータ」なんて基準は丸めてゴミ箱へ捨ててしまえ!と思っていたりする程度に違いはあるのだけれど、ここまで独創的なオープンデータは自分の観測範囲内では初めて見た。

個人的には利用規約等の見直しがはかられることを期待しているが、今のところ指導するような立場の機関も人間もいないようなので、このままズルズルと進むのかもしれない。

今後、各自治体等へのオープンデータ化の圧力が高まるにつれ、こういったオープンではないオープンデータも増えていくと予測されるが、今回のデータがちゃんと修正されるかはあるいみ試金石ともいえるので注意して追っかけようと思う。

まぁ、細かいことを言えば「オープンデータだけど、商用利用は禁止します」みたいなデータはすでに結構あるし、例によって形だけは「オープンデータ先進国」みたいになる可能性もわりと高いと思うけれども。