« [SNS][勉強会]オフ会、学会、勉強会のターゲット戦略 | トップページ | [DHT]DHTオフ会参加者募集について »

2005.05.18

[DHT]P2P分散プロキシの検討:その1

さて、これから数回に分けてDHTを用いたP2Pプロキシについて解説を行う。
進め方として大きく分けて
・P2P分散プロキシの実現方法の概略と実装時の注意点
・P2P分散プロキシの匿名性の議論(DHT-P2PプロキシはTorを超えられるか?)
・P2P分散プロキシの将来性
について書いていく予定だ。

さて、DHTによるP2P分散プロキシは既にHPで実現方式を書いてある。
分散ハッシュテーブルのP2Pアプリへの応用:その2

簡単に書くと、ノードAがブラウザでURL=url1を見たいときにはNode_ID=hash(url1)となるノードXにアクセスすれば良い。このときに、ノードAがノードXを検索するために介在するノードP1,P2.....PZをプロキシとすれば、ノードAはノードXに対して、多重プロキシを介することになり、結局誰がURL=url1を見ようとしているのかわからないといことになる。匿名性を薄めたければ多重プロキシを無効にすればよい。
ここでノードXのように直接ターゲットとなるWEBサーバあるいはストリーミングサーバにアクセスするノードをGWノードと定義しよう。

では、実際にP2P分散プロキシを実現するための注意点を書いていこう。

まず、ノードXはhash(url1)となっているが、このときにurl1にアクセスが集中するとノードXは当然負荷が重くなる。
負荷を分散する方法を考えよう。

簡単な分散方法として、url1にアクセスする時には、乱数をrand()として、Node_ID=hash(url1+rand())となるノードにアクセスすれば良い。こうすれば、特定ページに人気があっても、あるノードに負荷が集中する事はない。

次に今はNode_ID=hash(url1)のようにURL毎にGWノードを変えると、DHTのNW負荷が高くなることが考えられる。これはURLが異なる毎にGWノードへのルーティングを計算しないといけないからだ。またこのルーティングによってページの表示に遅延が出ることが考えられる。
これを克服するには、ある時間毎にGWノードを変えることも考えられるだろう。すなわち、Node_ID=rand()+Time()のような関数で、Time()は一定時間毎に値が変化する関数である。このNode_IDとなるノードにアクセスすべきURLの情報を渡す事になる。こうすれば、NW負荷はNode_ID=hash(url1)の時よりも大分減るだろう。

ストリームを受信するときには注意を要する。ストリーミングサーバからクライアントがストリームを受信する際、クライアントのIPアドレスが変化すれば、当然ストリームは中断してしまう。ということは、少なくともストリームが流れている間はストリーミングサーバ⇔GWノードのセッションは維持しないといけない。
一つの解として、ストリーミングを受けている間は、間にかますプロキシノードが変化しないと言う事が考えられる。それだと匿名性が薄まると懸念する人は、Node_ID=rand()+Time()となるノードを中間プロキシノードとして指定して、GWノードは固定するという手がある。こうすれば、GWノードから見ると誰から受信しているかサッパリわからないということになる。ストリーミングを受信して他方に渡す技術はP2Pストリーミングの技術が確立しているから可能であるだろう。

次回はP2P分散プロキシとしてDHTを使うと果たしてどの程度まで匿名性を高められるか検討してみる。
そしてP2P分散プロキシにおける匿名性と非匿名性のバランスについても議論する予定である。


|

« [SNS][勉強会]オフ会、学会、勉強会のターゲット戦略 | トップページ | [DHT]DHTオフ会参加者募集について »

P2P」カテゴリの記事

コメント

コメントありがとうございました。

A1:
GateWayの略です。Ringochや新月のゲートウェイノードに引っ掛けています。
つまりノードAから「仮想的に」インターネット⇔DHTネットワークの境界に見えるノードZを意味します。

A2:
NetworkのNとWです。

通信業界ではよくゲートウェイをGW、ネットワークをNWと略します。

あとはファイアウォールをFW,スイッチをSW(L3SW,L2SWとか)、ルータをR、ロードバランサをLBとか略しますね。

投稿: Tomo | 2005.05.20 01:44

■質問(その1)■
GWノード(直接ターゲットとなるWEBサーバあるいはストリーミングサーバにアクセスするノード)のGWは何の略ですか?
■質問(その2)■
"こうすれば、NW負荷はNode_ID=hash(url1)の時よりも大分減るだろう。"の"NWは何の略ですか?
NetworkのNとwですか?

投稿: Kiyoshi | 2005.05.19 11:21

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/18781/4174418

この記事へのトラックバック一覧です: [DHT]P2P分散プロキシの検討:その1:

« [SNS][勉強会]オフ会、学会、勉強会のターゲット戦略 | トップページ | [DHT]DHTオフ会参加者募集について »