データ・マスキングについて - 著作権

スマホで表を見る場合、画面を横向きにし、必要ならPCビューにしてください。

※このページはトップページにリンクを貼っています。

 昨日から6月13日と6月14日のコメント欄で合格者データの流用は著作権違反ではないかと指摘が続いていますが、大学合格者数データそのものは創作物でないので、過去の判例を調べたところ、その数値表示はデータ量の多寡に関わらず著作権違反になることは決してありません。またデータベースの著作権もデータの関連付けや検索方法が著作権に該当し、データそのものは著作権の対象外です。
 それでもデータの流用で訴訟が起きるのは金銭的損害が明白なときです。多くが同業他社に対して行われます。先日、週刊ポストサンデー毎日の東大合格者数データを無断で利用したことがニュースになりましたが、この場合、争点になるのは、週刊ポストが東大合格者数データを流用したことで他の週刊誌の売り上げが明白に落ちた場合です。週刊ポストが謝罪したのは、業界の慣習を破り、他社の売り上げに影響を与える可能性があったことであり、著作権違反での謝罪ではありません。
 別の表現でいいますと、サンデー毎日が高校別大学合格者数を集計するのは週刊誌を売るためのコストであり、そのコストを分担せずに同業他社の週刊ポストサンデー毎日のデータを無断利用して週刊誌を売ったのが問題なのです。本来であれば正規の手続きで事前にデータを買うことによりそのコストを分担すればよかったのです。
 また、週刊誌による無断転載禁止の注意書きですが、号により注意書きがあるものとないものがあります。私は結構チェックしています。注意書きの有無に関わらず、週刊誌の全データ(例えば3000校もの合格数データ)をエクセルに打ち込んで野放図にネットに流したら、何らかのペナルティはあるかもしれませんが、限られた部分集合の数字表記は引用の範囲内です。
 このブログは、独自の加重指標で学校評価を行っていることから、作者が恣意的に数字を操作していないことを読者が検証できるように、合格者データと計算式を公開していましたが、不必要に生データをおくのも不測の*1危険性があると判断して、今後はデータに以下のマスキング処理を行うことにします。

  • 東大早慶合格率や七帝大相当率のように率で評価する記事は、卒数や合格数の生データについては、表中にある数字に何らかの記号でマスキングします。
  • 新規の記事だけでなく、過去の記事に対しても随時マスキングを行います。
  • ごく一部の高校だけを対象にして、合格数で比較している記事の表は、引用の範囲内であり、データの網羅性がないので、マスキングの対象外とします。
  • 過去記事に対するマスキングの進行状況はこの記事でお知らせします。

過去記事のマスキング

  • 2014/07/01: 2014年の七帝大相当率関連記事のマスキング完了
  • 2014/07/04: 2014年の東大早慶合格率関連記事のマスキング完了
  • 2014/07/05: 2013年の七帝大率関連記事(全国)のマスキング完了
  • 2014/07/06: 2013年の七帝大率関連記事(北海道,東北)のマスキング完了
  • 2014/07/06: 2013年の七帝大率関連記事(北陸甲信)のマスキング完了
  • 2014/07/11: 2013年の七帝大率関連記事(東海)のマスキング完了
  • 2014/07/12: 2013年の七帝大率関連記事(関西,中国四国,九州)のマスキング完了
  • 2014/07/12: 2013年の七帝大率関連記事(関東,公立中高一貫)のマスキング完了
  • 2014/07/12: 2013年の東大早慶合格率関連記事のマスキング完了
  • 2014/07/13: 2012,2011,2010年の東大早慶合格率関連記事のマスキング完了

検討中記事

  • 20130527/p1
  • 東大早慶合格率現役編
  • 東大早慶進学率1992
  • 都道府県別東大在籍者数
  • 20110319 以前の記事

 7月13日の時点で、世間慣例レベルの生データ公開量に抑えたと判断しましたので、一旦集中的なマスキング作業は終了し、今後は、必要と判断した連載について、便宜過去記事も含め、マスキングを行っていきます。

*1:例えばブログの閲覧者にコピーされる