[P2P]キャッシュの拡散・効率について
昨日はキャッシュについて書いたのだが、ひとつ気になる点があったので更に書いておく。
Winnyなどのキャッシュについては匿名性の観点から議論されることも多いが、キャッシュの拡散や効率性についてはあまり議論されてないように思える。キャッシュ機能により、ファイルのダウンロード元が分散され、効率のよいP2Pファイル共有が実現するのである。この効率性に関する論文はあまり見てはいないので研究すれば面白いと思う。シミュレーションするのもそれほど難しくはないだろう。(確かFreenetの関連で、この辺りの議論があったかもしれない。)
個人的に気になるところは、各ノードがどのくらいの頻度でダウンロード元になるかということと、どのくらいのスピードでキャッシュが拡散するかというものである。拡散については良く知られた拡散方程式を多少変形したもので求められると思う。もしかしたらランダムウォークの知識も必要かもしれない。
Winnyのように、ダウンロードの要求があってはじめて他のノードにキャッシュされるシステムもあるが、強制的に隣接ノードにコンテンツをキャッシュさせるシステムも検討されている。これも同様にシミュレーションして効率性などを検討すると興味深い結果が出るかもしれない。
プロキシの研究も参考になるかもしれない。
「プロキシ・キャッシュを用いたウェブサーバの性能解析法」
これに関して人気のあるコンテンツのキャッシュ率についての研究としてジップ(Zipf)の法則を挙げることがあります。
Zipfの法則とは、ある文章においてf(i)をその文章でi番目に良く出てくる単語の出現回数とすると、f(i)=a/i^bとかける事です。(^はべき乗を表わす。)
Zipfの法則は以下のHPを参考にしてください。
種々のフラクタル
Zipf曲線とウェブサイト人気度
いかがわしくないサーチエンジン対策
「P2P」カテゴリの記事
- [P2P]Websocketでブラウザ間P2P通信は実現できるか?(2011.10.30)
- TwitterをP2Pで実現する方法をもう少し考えてみる(2010.05.03)
- オフィスツアー(ビットメディア)を振り返る(2009.10.25)
- [開催日変更]オフィスツアー(株式会社ビットメディア)参加者募集のご案内(2009.08.14)
- [NAT]NAT越え入門1-NATとは何か?(2009.04.11)

Comments