« SBM標準データの考察~SBM研究の再現性を実現するために | トップページ | 2008年を振り返り、2009年の目標でも立てておくか。 »

2008.12.27

SBM標準データにおけるプライバシーの考察

SBM標準データについて、前回書いたエントリーの続きです。
SBM標準データの考察~SBM研究の再現性を実現するために

さて、今回はプライバシーの課題について考えたい。今回は以下のエントリーを参考にしている。

第二回SBM研究会 & 研究用データの公開方法
Cicindela には豪華なおまけがついてきます

(*livedoor clipのデータ公開[縮小版]の話です。要チェック!)

 

例として「はてブ」を考えてみよう。

議論1)はてブには一般にブックマークを公開しているモードと、自分だけが閲覧できるプライベートモードがある。果たしてプライベートモードの情報は標準データに入れるべきであろうか?

議論2)クリップ数が少人数のURLがあると、参加者IDを匿名としても人物が特定できる可能性がある。クリップ数が少ないURLは標準データからはずすべきだろうか?

議論3)コメントによって上記同様に人物が特定できる可能性がある。コメントは標準データーからはずすべきであろうか?

まず標準データのポリシーは、私自身の意見で言うと、できるだけデータを開示することだと考えている。なるべくフィルタリングしない、これが様々な研究で活かされることになる。

では議論1について考えてみる。

プライベートモードではSBM情報が外部から入手することが一般にはできない。今、とある標準データの参加者ID_Aがプライベートモードであるとわかったところで、それ以上の情報が引き出せることは難しそうだ。ID_Aから(リアルあるいはバーチャルで)誰かが推定されなければプライバシーの課題としてはクリアできるが、当然標準データの参加者IDはシャッフルされるはずであるなので、公開しても一見良さそうな気がする。

ただ、プライベートモードの場合は

・セルクマが多い「かも」しれない。(人物が特定できる)
・その人にとって公開すると問題となるURLが含まれている可能性がある。(仕事用、研究用、あるいはアダルトなど)
・コメントが過激になっている場合がある。(外部要因によってコメント内容が淘汰されない)
・コメントが外部に漏れたくない場合がある。(仕事用メモなど)

ことが考えられるので、公開するデータ項目については検討の余地があるだろう。少なくとも、プライベートモードとパブリックモードを識別できるようにはしないほうが良いと考えている。なぜならプライベートモードの人がなるべく特定されにくいようにするためである。プライベートモードの人のコメントについても同じように特定され易くなるので取り扱い注意である。プライベートモードでも標準データに掲載できるのは、「参加者ID(シャッフル済み)」「クリップしたURL」「タグ」「クリップした時間」までかもしれない。

もしかするとプライベートモードとパブリックなモードでは随分クリップしているURLの分野が違うかもしれない。それはおそらくタグやコメントの仕方についても。それはそれで非常に興味深い話ではあるのだが。。。。

議論2、3についてだが、確かにシャッフルされたIDから実の参加者IDが特定される場合はある。しかしSBMのパブリックサービスのIDが特定されても、既に公開している情報なので問題ないのではないか?という意見もあるだろう。標準データのIDから実の参加者のIDが判明したところで、その参加者に対する情報はそれ以上引き出せない。つまり、現状と情報が開示されているレベルは同じである。よって私はなるべく情報は公開すべきだと考えている。ただし、プライベートモードのコメントについては、議論1のように慎重に検討すべきだと考えている。

SBMサービスにおける情報が、既に公開されているものが大多数のため、標準データのプライバシーについては色々な議論があるだろう。多くの方の意見を伺い、標準データの検討が行われることが必要だ。

なお、SNSの標準データを考えると、更に慎重な議論が必要である。これについてはまた別の機会に。

|

« SBM標準データの考察~SBM研究の再現性を実現するために | トップページ | 2008年を振り返り、2009年の目標でも立てておくか。 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: SBM標準データにおけるプライバシーの考察:

« SBM標準データの考察~SBM研究の再現性を実現するために | トップページ | 2008年を振り返り、2009年の目標でも立てておくか。 »