ブログ

ウェブでのデータ共有

2010/02/05

2月に発売されたテイルズ社の雑誌 Nodalities はデータ共有に関して特集を組み、サイエンス・コモンズの Kaitlin Thaney の記事を載せています。

昨年10月のセマンティックWeb国際会議(*1)で、Kaitlin は Jordan HatcherLeigh DoddsTom Heath と共に”ウェブでデータを共有するための法的・社会的な枠組み”と題した4時間のチュートリアルを行いました。チュートリアルは、データ公開においてよく見られる法的・社会的問題に触れ、リンクされたデータから成るクラウドを先駆的な例として取り上げ、データ共有の取り組みに対して著作権上の制約や複雑な契約、明瞭さの欠如がいかに問題を悪化させるかを示しました。

参加したかったって?私も同じ気持ちです。幸運なことに4人のチュートリアルリーダは、Nodalities 誌にデータ共有に関するそれぞれの考えをまとめています。Kaitlin は2月号に「ウェブでのデータ共有」と題したすばらしい記事を寄稿しています。この記事をお見逃しなく。Nodalities 誌の2月号はまだ入手できませんが、Kaitlin の記事はここから読むことができます。

Nodalities 誌は CC-BY-SA でライセンスされていますが、Kaitlin の記事は彼女の希望により CC-BY でライセンスされています。

*1: International Semantic Web Conference

MichiganViewがCC0のもとでリモートセンシングデータをリリースしました

2010/01/29

サイエンス・コモンズのフェローであるPuneet Kishorは、地理空間の問題とオープンデータの専門家であり、サイエンス・コモンズブログの今回のエントリーのゲストブロガーです。

2010年1月28日より、MichiganViewは、ランドサット(地球資源探索衛星)5号と7号、NAIPより得られた93ギガバイト以上の画像データ全てを、クリエイティブ・コモンズによって提供される新たなCC0(CCゼロ)権利放棄を介してパブリックドメインで利用可能にしています。MichiganViewコンソーシアムは、ミシガン州の航空写真と衛星写真をウェブ上に公開し、自由に使えるようにしています。AmericaViewコンソーシアムの取り組みの一環として、MichiganViewは、教育や労働力開発、研究における画像データ・コレクションへのアクセスと利用を支援しています。CC0では、データセット内のあらゆる権利を放棄し、すべてのデータセットを誰もが何の障害もなく利用できます。

CC0に関するさらに詳しい情報はこちらから入手でき、プロトコルの根拠はこちらに記述されています。MichiganView について質問のある方は、MichiganViewのディレクターであるDr. Tyler Erickson (tyler.erickson@mtu.edu)へ、CC0について質問のある方は、サイエンス・コモンズのフェロー(地理空間データ)である Puneet Kishor (punkish@creativecommons.org) までご連絡下さい。

バベルを想起して:オープンデータの統合と共有

2009/11/19

CC0がリリースされて以来、私は多くの人にそれをいつ、どのように使うのかを話してきました。最近、科学者と科学政策の専門家のグループがletter to Natureにおいてパブリックドメインを用いたデータの共有を支持し、そのためにCC0を利用することを推奨しました。これは、我々のデータ共有への取り組みをはっきりと肯定するものです。ただ、多くのディスカッションにおいて避けられない議題となるのが、「パブリックドメインにデータを置くことができない、もしくは置きたがらないデータ所有者にはどのように対処すべきか?」という問題です。クリエイティブ・コモンズは、パブリックドメインと完全制御(機密)の間にある、柔軟なライセンスオプションのセットの提供を支援できるのでしょうか。

最初に、今回出てくる「データ」という言葉の意味合いを明示しておかねばなりません「データ」という言葉自体には、音楽や映画、写真、その他の著作権を付与できるあらゆるものが含まれますが、ここではより狭く具体的に「それ自体には著作権を付与できない事実やアイデア、概念」という意味で使うことにします。たとえば、アインシュタインの示したE=MC^2という方程式、エベレストの標高、ある星の座標などが含まれます。これらのデータが保護を受けないことは、Feist Publications vs. Rural Telephone Serviceの事件において支持されています。この事件において、米国最高裁判所は、オリジナリティが著作権成立のための基本的な憲法上の前提条件であると指摘しています。 O’Conner判事は、多数派の意見として次のように述べています。「事実に対してオリジナリティを主張する人はいないだろう、というのは著作権における根本的な原則である」(強調は引用者による)。米国著作権法は、この概念を著作権保護の範囲における制限として成文化しています(102(b)節)。同様に、他の国もオリジナリティの要件におけるこの制限を認識しています。

こういった著作権適用範囲における基本的な制限は、著作権とは本質的に、創造的なアウトプットをした著者に報いたいという願いと、すべての人が利用できる事実とアイデアの泉を保護する必要性との社会的な歩み寄りによるものであることを踏まえています。このような事実とアイデアの「コモンズ」がなければ、社会的な議論や創造性は害されてしまいます。Lawrence Lessigが著書のThe Future of Ideasで書いているように、「自由に利用できる資源はイノベーションや創造性に不可欠なもので…それらがなければ、創造性は損なわれてしまいます。したがって、とりわけデジタル世代にとって、資源を管理するのが政府と市場のどちらであるべきかは問題ではなく、そもそも資源が管理されるべきか否かということ自体が問題なのです。単に管理が可能だからといって、それが正当化されるわけではありません。むしろ、自由な社会においては、管理システムを守ろうとする者が正当化する説明責任を負うべきなのです。」

しかしながら、著作権による管理は、その範囲・持続期間の両面において劇的に広がっており、先述したようなデリケートな社会的歩み寄りにひずみを生んでいます。皮肉なことに、伝統的な著作権の適用範囲を越えた管理システムを広げることへの関心を改めて呼び起こしたのは、並外れたパワーと制約のなさをもつインターネットが成長し、成功したことでした。無数の事実とアイデアを含むデータベースは、それらが公開、共有されてパブリックドメインとみなされると、それらを管理する新たなシステムをつくることが課題になります。ヨーロッパでは、著作権保護をするに値しないほどオリジナリティがない場合でさえもデータベースとそのコンテンツを保護する「独自の (sui generis)」データベース権を、EU主導で各国が行使しています。他の国々では、完全なオリジナリティや創造性を要求しない緩やかな著作権基準の下で、データベースに対して著作権保護を付与しています。

最終的には、著作権やその他の法的な権利ではなく、単に自発的な同意を前提として、契約法(クリックラップ契約やWebサイト利用規約など)に基づく管理システムを構築しようという動きがあります。契約は、著作権のような管理の範囲を、従来の著作権や独自の保護の範囲を越えて拡張させ、実際のところ同意の法的強制力(これ自体議論の余地があります)以外に元々制限がありません。問題とされるのがデータの状態ではなく契約に従うことに同意したかどうかであるので、そのような契約は、著作権の付与できないデータに対しても適用されるだけでなく、既にパブリック・ドメインに置かれたデータの管理にも及ぶことがあり得ます。最近の例では、とりわけOpenStreeetMapコミュニティによる採用が考慮される、Open Data CommonsのOpen Database License (ODbL)があります。Open Data Commonsは、オープンなデータ共有の強力な支持団体であり、これを推奨するだけでなく、Public Domain Dedication and License (PDDL)などの重要なコミュニティツールを提供しています。過去にリリースされたPDDLと違い、新たなODbLは、特に表示(attribution)と継承(share-alike)の義務を含むのが特徴です。その契約条件は、著作権や独自のデータベース権に課されるだけでなく、それらの保護がなくても契約として機能することを目的としています。結果として、著作権や独自の権利さえも及ばないデータに、義務を課そうとしているのです。

CC0によって、クリエイティブ・コモンズは別のアプローチをとっています(むしろPDDLと類似したアプローチを継続しています)。CC0は、データの管理権限を放棄して、パブリックドメイン(もしくは法的に可能な限り近い状態)にする手法です。以前別のところ(PDF)で説明したように、我々は「帰属表示の蓄積(attribution stacking)」がもたらす実用上の影響やデータ共有コミュニティにおけるライセンス互換性の問題を懸念しています。帰属表示の蓄積は、多くの情報源を利用する大規模なデータ共有プロジェクトの負担となる可能性があり、ライセンスの互換性の問題は、データ統合に向けた努力を阻んでしまう可能性があります。

私が注目する分野の一つである科学分野において、パブリックドメインでデータを共有することは、古くから続く名誉ある伝統の一部です。インターネット以前では、データは、存在する場合には印刷されたジャーナルとして出版されていました。論文自体には著作権が適用されるかもしれませんが、そこで明らかにされた事実やアイデアは、パブリックドメインにあると見なされます。インターネットとデジタル技術の出現によって初めて、それらの事実やアイデアを含むデータベースのコンテンツに対する「ライセンシング」が注目されました。したがって、コミュニティに対してうまく機能していた(そしてうまく機能し続けている)パブリックドメインを介したデータ共有の確立された伝統がある分野において、新たな管理システムを導入する際には、その正当性を示すだけの厳しい条件を満たさなければなりません。しかし、他のライセンシング・スキームに関する我々の経験から考えると、そういった管理にはリスクが伴います。帰属表示のようなシンプルな要件であっても、膨大なデータ要素が集積した際に、非常に深刻な負担となり得ます。科学者は正当な科学的根拠に対して、帰属表示(と引用)を提供するべきであり、何をどのように帰属表示するかの決定において、重要な構成要素である常識や専門家の判断に勝る柔軟性を備えた法的な要件は存在しません。さらに、ライセンスに互換性がない問題、特に継承ライセンスに関する問題は、データベースやデータ源を結合、統合すること、それからデータを再利用することの妨げになり得ます。それらは全て、科学データの有用性に悪影響を与える可能性があります。

そのようなリスクを考慮すると、パブリックドメインからの離脱に正当性はあるのでしょうか。データプロジェクトのオーガナイザー達が雄弁に語ったことですが、データの提供者に対して何らかの管理権限を選択する余地を与えないと、彼らはアクセスを提供することを躊躇したり、嫌がったりします。また、条件付きの、制限された共有であっても、なにも共有しないよりはましなのです。データに価値があればあるほど、これらのデータをパブリックドメインに無条件で提供しようとは考えない傾向にあるので、極めて価値のあるデータセットは、上記のような制限を受けるだろうとオーガナイザー達は語ります。そんなわけで、CCが提供する著作権ライセンスのような段階的な管理システムを提供しないことにより、データ共有の貴重な機会は失われ、これらのコミュニティ、場合によっては全ての人にとって深刻な結果を招くかもしれません。私は、これがあまりにも独断的にパブリックドメインに固執することへの強い反論であることを認めざるを得ず、それが正しいならば、他のアプローチが正当であるとするかもしれません。

問題は、より多くのデータをパブリックドメインよりも制限された条件の下で利用すべきかということ、それから、それらの制限がコミュニティに対するそのデータの価値をどれほど損なってしまうのかということです。私は、完全な答えが見つかったとは考えていません。これは、間違いなく、社会学者や他の学者による実証的証拠に基づいたさらなる研究が進められるべきテーマです。しかし、答えの出ないこの状況で何をすべきでしょうか?私はレッシグの言葉に立ち返ります。「正当であることを証明する責任は、管理システムを守ろうとする者が負うべきである。」データ共有におけるより限定的なシステムについて言えることは、せいぜい「答えは出ていない」ということだと思います。そういうわけで、我々はデータ共有にパブリックドメインやCC0を利用することを勧めるのです。