ご存じ方が多いと思いますが、2013年12月にpublishされた
Data Protection Principles for the 21st Century Revising the 1980 OECD
Guidelines
を読んで、勝手な感想を書いてみました。(tw,fbでも書いているモノの集積で
す。)
この記事から最近のEU Data protection directive/act の流れの背景も理解できま
すね。
http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCcQFj
AA&url=http%3A%2F%
2Fwww.oii.ox.ac.uk%2Fpublications%2FData_Protection_Princi
ples_for_the_21st_Century.pdf&ei=_zYDU_32GoePlQWH14CwAQ&usg=AFQjCNFKf66M4OmJ
-hxctbA8hxsEFlf0Og&sig2=ql9t92gj1KIWztsJFDt92A&bvm=bv.61535280,d.dGI
Section of :The OECD Guidelines in a Changing World:
1980のOECDのガイドラインが出されたころに比べてビッグデータ時代になった現在、
「同意」があればよろしい、みたいな牧歌的な世界ではない。データ収集時には未来
のデータ利用法を見切れないし、個人はプライバシポリシを読み切れない。
Section of : The Path to Revising the Guidelines:
同意は表面的には必要であっても、ほとんど実質的な意味がなくなってきている。1
年に244時間もかけてプライバシーポリシーの同意の内容文書を読む人は皆無。本質
は、個人データから発生する危険と、データの自由流通と利用による利益の適性なバ
ランス.
Section of :The Revised Principles:
deidentification(匿名化):完全な匿名化ができる技術は存在しないので、どの程
度の不完全性を許容するかの見積もりが必要。また、法制度で押さえる部分との役割
分担、流出した場合の危険性の程度を総合的に考慮する、という定義
個人データ:個人をidentifyできる全てのデータ。他のデータベースとの突き合わせ
によるリンク攻撃が可能なデータも個人データとする。ただし、匿名化されたデータ
は含まず。注意深く考えると、これは定義が堂々巡りになっているような。
これは、我々のSCIS2014論文のB,C属性データも個人データと見なすべきという主張
に近い(というか、時間的はこのガイドラインのほうがご先祖様)
個人データの利用:利益と個人の不利益のバランスを重視するが、身体的な被害が生
ずる利用は絶対避けるべきとある。例のGoogleのサジェストが不利益単語を表示する
場合は許容されるな。一方、ストーカー被害を誘発する場合はどうなるか??
個人の権利:おお、やっと本質的改訂の部分だ。自分のデータの使われ方、訂正要
求、削除要求をデータ業者は遅滞なく確実に行わなければならない(=個人の権
利)。これがあるから、上で述べた利益と不利益のバランスの議論が成立するんだよ
ね。
したがって、Scheonbergerの論旨がここで一貫するわけだ。だけど、この実装ってど
うやったら可能なの?技術側にとってはやたら難問。
ともあれ、以上の概念定義に沿って、データ業者は個人データの利用に関して説明責
任(accountability)が要求される(当然ですな)。だが、個人データにリンクして
いるデータについてまでは説明責任を問われない(そこまで厳しいとやっちゃられ
ん)
Enforcement Principle:で、最期にこういうガイドラインは政府が資金を出した
り、法律を作ったりしてeffective にenforce(執行)しなきゃいけないとしてい
る。1980年のガイドラインでは、そこが甘かったと反省している。
----
中川裕志