percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事...

42
情報技術論 (2013/05/13) パーコレーション:浸透の数理 増田 直紀 工学部 計数工学科 h+p://www.stat.t.utokyo.ac.jp/~masuda [email protected]

Transcript of percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事...

Page 1: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

情報技術論  (2013/05/13)パーコレーション:浸透の数理

増田 直紀

工学部  計数工学科h+p://www.stat.t.u-­‐tokyo.ac.jp/~masuda

[email protected]­‐tokyo.ac.jp

masuda
テキストボックス
コピーライトの関係で出せない図のスライドは削ったので、配布した資料より若干少ないです。
Page 2: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

• 抽象化:–山火事、感染症、環境破壊 → つながっていたものがつながらなくなること(またはその逆)

• モデル化:–パーコレーション

• 情報技術–インターネットウイルス、情報伝搬などへの応用

Page 3: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

サイト・パーコレーション

4

● 確率 q○ 確率 1 - q

一度決めたら動かない(静的)

q  <  qc q  >  qcつながりが小さい つながりが大きい

0v 0v

Page 4: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

5

● 金属○ 絶縁体

Page 5: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

パーコレーションは強力なモデル• 歴史:

– 1941:    ブローリー  &  ストックマイヤー  (物理)

– 1957:  ブロードベンド  &  ハマスレー  (数学)現象 頂点 枝 ● ○山火事 土地の区画 区画の隣接 木 空き地

混合物 物質の区画 区画の隣接 金属 絶縁体

感染症 人 人の接触 病気 健康

コンピュータ・ウイルス

端末など ケーブル等 感染 正常

インターネットの稼働

端末など ケーブル等 正常 故障

生態系  (1) 生息地 道 正常 機能×

生態系  (2) 生物種 捕食ー被食 種がある 種が絶滅

Page 6: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

q(黒石の確率)

(最大)黒石ネットの大きさ

10

?

?

真っ黒真っ白

?

Page 7: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

q 10真っ黒真っ白 臨界値(臨界確率)

qc

(最大)黒石ネットの大きさ

•相転移•臨界現象•qc はネットワーク依存

qcqc qq

Page 8: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

2つの相の解釈現象 q ≤ qc q > qc山火事混合物感染症

コンピュータ・ウイルス

インターネットの稼働

生態系 (1)生態系 (2)

抑圧されている 広がる

絶縁体 伝導体

抑圧されている 蔓延

抑圧されている 蔓延

分断 全体として稼働

機能× 正常

分断し,不安定 連結で,安定

Page 9: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

1次元格子

• q  <  1  なら

• したがって  qc=1(例外的)

v0

Page 10: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

木• 次数 = k

• “遠方” に向かう k-1 頂点のうち1つが黒石ならよい.

• qc = 1/(k-1)

• 他にも

• 正方格子: qc ≈ 0.593

Page 11: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

2 種類のパーコレーションサイト・パーコレーション ボンド・パーコレーション

0v0v

Page 12: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

2つのパーコレーションの qc

サイト ボンド

1次元

2次元(正方格子)

3次元

1 1

約 0.593 0.5

約 0.312 約 0.249

1/(k-1) 1/(k-1)

Page 13: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

Poisson  Boolean  model• ワイアレス機器

• 半径はノードごとに異なる場合も

Page 14: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ボンド・パーコレーションの威力

• 枝が「開いている」確率  =  q

• 静的なモデルなのに,実は,動的な感染症モデルに対応

0v

Page 15: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

SIR  モデル  (Kermack  &  McKendrick,  1927)

健康 (S)病気 (I)免疫 (R)

感染

治癒

λ

μ

• 2 回は感染しない(免疫 or 死)状況

• インフルエンザ

• エイズ

• SARS

• 黒死病

• はしか

• 噂

• 被害の大きさ = 最終的な R の数(割合)

Page 16: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

最後は,S と R だけになる

R

I

S

時間

人数

Page 17: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

SIR  モデルの解析

22

dS(t)

dt=− λS(t)I(t)

dI(t)

dt=λS(t)I(t)− µI(t)

dR(t)

dt=µI(t)

健康 (S) 病気 (I) 免疫(or 死)(R)

Page 18: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

�S(t = 0) ≈ 1

I(t = 0) ≈ 0 λ > µ λc = µ23

dS(t)

dt=− λS(t)I(t)

dI(t)

dt=λS(t)I(t)− µI(t)

dR(t)

dt=µI(t)

dI(t)

dt

����t=0

= [λS(t = 0)− µ] I(t = 0) > 0

のときに流行

Page 19: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

SIR モデルの相転移

λλc

被害

qqc

ボンド・パーコレーション

q  = 1  - exp(-­‐λ/μ)

Page 20: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

実際のネットワークは?

現象 ネットワーク

山火事

混合物

感染症

コンピュータ・ウイルス

インターネットの稼働

生態系  (1)

生態系  (2)

正方格子

3  次元格子

複雑

複雑

複雑

複雑

複雑

Page 21: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

2つのパーコレーションの qc

サイト ボンド

1次元

2次元(正方格子)

3次元

スケールフリー

1 1

約 0.593 0.5

約 0.312 約 0.249

1/(k-1) 1/(k-1)

? ?

Page 22: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

スケールフリーで何が起こる?

• サイト・パーコレーションで考える– ボンドでも結果は同じ

• スケールフリーとそうでないネットワークを比べる– 次数は揃えておく

• 結論:スケールフリーでは  qc  が小さく,つながりが広がりやすい– 感染症は広がりやすい

– インターネットや生態系は保たれやすい

0v

Page 23: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

問題スケールフリー・ネットワークとスケールフリーでないネットワークでは,どちらが感染が広がりやすいか

Page 24: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

説  1

• スケールフリーでは,ハブがたくさんの人に広めるから,スケールフリーの方が感染は広がりやすい.

→  誤り!

Page 25: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ハブの効果スケールフリーでないネットワーク

スケールフリー・ネットワーク

注:感染ダイナミクスかのように扱っているが,静的としても結果は同じ

Page 26: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ハブ

•自分の友人は自分より有名•ネットワークを歩けばハブに当たる

?4/11

1/11

1/11

1/11

3/11

2/11

6/10

3/10

1/10

Page 27: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ハブがあると• ハブに感染が入りやすい

• ハブは感染を広めやすい

• スケールフリーでは感染が広がりやすい

• インターネットや生態系は保たれやすい

Page 28: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

qc =�k�

�k2� − �k�

p(k) = ck−γ =⇒�k2

�=

∞�

k=1

ck2−γ = ∞ (γ ≤ 3)

数式を用いて言うと

• 少しの黒石の割合  q  でも,大きく広がる!–嬉しいか嬉しくないか?

–実現象  →  抽象化モデル  →  モデルに対する数理的結果  →  実現象での解釈

次数の平均

次数の2乗平均

Albert,  Jeong  &  Barabási,  2000;  Cohen  et  al.,  2000;  Callaway  et  al.,  2000

Page 29: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

現象 q  <  qc q  >  qc スケールフリーでは

山火事 抑圧されている

広がる -­‐

混合物 絶縁体 伝導体 -­‐感染症 抑圧されて

いる蔓延 広がりやすい

コンピュータ・ウイルス

抑圧されている

蔓延 広がりやすい

インターネットの稼働

分断 全体として稼働

頑健

生態系  (1) 機能× 正常 頑健

生態系  (2) 分断し,不安定

連結で,安定

頑健

Page 30: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

インターネット再考-­‐ サイト・パーコレーションをもとに考える

-­‐ インターネットなら

-­‐ ● 正常稼働.確率  q

-­‐ ○ 故障.確率  1−q

-­‐ q=1  から  q  を徐々に減らしてみる

-­‐ ○  が増える  →  徐々に故障が増える

-­‐ スケールフリーなら,大多数が故障  (q  ≈  0)  してても浸透が起こる(大部分が1つにつながっている)

0v

Page 31: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

選択的攻撃-­‐ こちらの好みの順番で白石を置くこと.

-­‐ ネットワークを分断するのが目的

-­‐ コンピュータ・ウイルス開発者,テロリスト,スパイ

-­‐ 感染症なら

-­‐ 元のネットワークは「事前」のネットワーク

-­‐ ● 健康

-­‐ ○ 予防接種

-­‐ 少ない予防接種で,感染症の潜在的な危険を減らしたい

-­‐ ハブを狙うと効率的

Page 32: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

選択的攻撃(ハブから)N=20

q = 1q = 0.95q = 0.9

Page 33: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ランダムな故障(パーコレーション)N=20

q = 1q = 0.95q = 0.9q = 0.85q = 0.8q = 0.75q = 0.7q = 0.65

Page 34: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

選択的攻撃の解釈パーコレーション 選択的攻撃

ランダム・クラブ

スケールフリー

インターネットへの攻撃

感染症への予防

中程度 中程度

つながっていやすい 分断しやすい

効果少 効果大

難 容易

結果の善悪は,解釈次第

Page 35: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

• ハブを狙って対処すればよい

• 予防接種

• 隔離

• スケールフリー・ネットワークは選択的攻撃に弱いとも.

• しかし,どうやってハブを見つける?

Page 36: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

輪状接種• 友達はハブでありやすい

• あなたの友達は,あなたより有名!

• 知人を接種する

• 2  人以上の人から知人として挙げられた人を接種するのも効果的

• ↔  集団(マス)接種

• ある地域の人を皆接種

• 輪状接種よりも効率が悪い

Page 37: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

ハブが全て?

ハブ

橋渡し頂点

→ 「媒介中心性」などの利用

Page 38: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

コミュニティ構造をもつネットワーク

広がらない 局所的に広がる 大局的に広がる

重要でない,と見なしたい

Page 39: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

故障と攻撃の両方に備える

•次数は2種類だけ • ハブが選択的にやられても大丈夫• ネットワークの

設計

N=10094 頂点は k=36 頂点は k=17

Page 40: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

三角形のパーコレーション

コミュニティ検出

Page 41: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

• 私の HP の「書籍紹介」 http://www.stat.t.u-tokyo.ac.jp/~masuda/books.html に拙著の情報

• そこからダウンロードできる赤い本の補遺 (PDF) には各種啓蒙書の情報も. 2010 20072006

専門的 一般向け

2012

Page 42: percolation - 東京大学chik/InfoTech13...2つの相の解釈 現象 q ≤ q c q > q c 山火事 混合物 感染症 コンピュータ・ウイルス インターネットの稼働

課題(以下から2つを選択)

• 授業で触れなかった中心性の指標を2つ調べ,それぞれを5行以上で説明せよ.

• ページランクの応用例について,授業に触れなかったものを1つ挙げ(調べたものでも,自分で考えたものでもよい),8行以上で説明せよ.

• SIS  モデルについて調べ,SIR  モデルとの対比をしながら,10行以上で説明せよ.

• インフルエンザの流行をおさえるのは何故難しいのか.10行以上で自由に論ぜよ.