PPDUのみなさま
データベースにおけるプライバシー保護の方法として、
(1)これまでサンプリングをして小さなデータベースを作る
(2)k-匿名化
などが考えられてきました。一方、まったく別系統のアプローチとして
(3)差分プライバシーも研究がさかんです。
しかし、これまで、これらの方法は互いにどういう関係にあるのかあまりはっきりしていませんでした。
Ninghui Li, Wahbeh Qardaji, Dong Su: On Sampling, Anonymization, and Differential Privacy: Or, k-Anonymization Meets Differential Privacy. Proceedings of the 7th ACM Symposium on Information, Computer and Communications Security(ASIACCS’12).
は、これらの関係を本格的に論じた初めての試み(著者曰く)として興味深いものだったので、読んでみました。
差分プライバシーは質問への回答出力に雑音を加算する手法というイメージが強いのですが、実は、2個のデータベースの差分(=個人に対応するタプル)が暴かれる確率を定式化しているところが需要です。
この論文は、差分プライバシーをこのように安全性の評価尺度として用いることで、サンプリングやk-匿名化を比較しています。
面白かったので、まとめを作ってSlideShareにアップロードしました。よろしかったらご覧ください。(アップロード後11時間で150viewなのでまずまずの滑り出し)
http://www.slideshare.net/hirsoshnakagawa3/samplimg-kanondp
中川裕志