Suicaのデータ販売中止騒動、個人特定不可なのになぜ問題? ビッグデータの難点

JR東日本のICカード・Suicaの情報(ビッグデータ)が、6月末に販売開始された。しかし、発売直後から「個人情報保護の観点で問題があるのでは?」という指摘が、同社に対し多数寄せられ、7月25日には販売中止を宣言。販売再開は予定されているとはいえ、身近なビッグデータ活用はわずか1カ月で止まってしまった。
 この騒動はなぜ起きたのか? 情報を整理してみよう。
●提供される情報は「個人情報」ではない
 個人情報というのは、住所や名前、生年月日、職業などの各種情報が「本人を特定できる形で」あることをいう。例えば、「東京都千代田区永田町1-7在住・田中一郎」ならば本人が特定できるから個人情報になるが、「35歳・男性・公務員」というような情報は個人情報にならない。
 それを踏まえて考えると、今回販売するビッグデータは、まったく個人情報ではない。SuicaにはIDがあり、各種情報はIDに紐づけて管理されているが、販売情報には、購入時に登録した名前や住所などは一切含まれない。しつこく追いかければ「平日朝6時半にA駅の改札を通り、駅のホームで水のペットボトルを買って、8時にB駅の改札を出て、18時半にB駅から入り、20時にA駅を出る28歳の男性」くらいまでは読み取れるかもしれない。しかし、長期的にひとつのIDのデータを追いかけることはできないようになっているというから、個人の行動を特定することはできないようだ。
 Suicaのデータ販売に関する第一報の段階で「個人情報を含まない形で販売」と報じられていたが、具体的にどのようなデータが含まれるのかが、わかりづらかったことと、近年の日本における、過剰な個人情報保護の感覚とが結びついたことが、今回の騒動の発端だと考えられる。
●誰でも買える・使えるわけではない
 今回の騒動の発端となったデータ販売については、JR東日本が日立製作所に販売しただけだ。日立がデータを利用して、駅エリアのマーケティング情報として契約企業に提供するサービスを行う予定だった。もともとJR東日本は、個人には販売しないし、日立も「A駅で毎朝電車に乗る20代後半の男性の、勤め先があると思われる駅を教えてください」などという依頼には応じないだろう。
 しかも販売にあたっては「提供先で他のデータと紐づけたり、目的以外の利用ができないよう契約で厳格に禁止」しているという。つまり、駅前のコンビニの購買データや、駐輪場の監視カメラ映像などと合わせて分析することで、個人を特定してはいけないということになっているのだ。
●マーケティングに使うための群衆データ
 このデータは何千、何万というデータをまとめて分析して「この駅の利用者には高齢者が多い」とか「この駅は繁華街があるせいか、30-40代男性が夜間によく利用している」とか、そういうタイプの情報を引き出すために使われるものだ。「どんな人が多くいるのか?」「どの時間帯がにぎやかなのか?」というようなことを分析して、新規店舗の出店や広告展開に利用する。
 個人の行動を追うためのものではないし、追うことができないようにデータは加工され、プライバシーに配慮した契約を締結した業者しか使えないことにもなっている。あまりにも特徴的で、個人の特定につながりそうなデータについては、数値表示やグラフ化を行わないという配慮もあるようだ。
●気持ち悪い人は拒否も可能
 問題になってしまった原因は、細かい内容がわかりづらいまま、データ販売の事実だけが報道されてしまったためだろう。「ビッグデータ」という、IT業界におけるトレンドワードではあるものの、一般的には馴染みの薄い、実態のわかりづらい言葉が使われたことも「よくわからないけど不安」という気持ちを煽った部分があるはずだ。
 JR東日本としては、個人情報ではないのだから、許可はそもそも必要ないという考えだったようだが、事前に許可を取らなかったのが問題だという見方もあるため、現在は一時販売を停止した上で、Suicaに記録されている情報の収集拒否申請の受け付けを行い、拒否申請のなかったデータについてのみ、許可済とみなして販売再開する予定となっている。
「気持ちが悪い」「なんだか不安だ」という人は、メールで収集対象になることを拒否できる。細かい疑問への回答と拒否方法は、JR東日本のHP(http://www.jreast.co.jp/pdf/20130725_suica.pdf)上で公開している。ちなみに、対象となっているのはJR東日本が発行したSuicaおよびモバイルSuicaだ。

タイトルとURLをコピーしました