IBIS2008 2008年10月29日～31日...

２００８年１０月２９日～３１日ＩＢＩＳ２００８

密度比推定の手法と応用密度比推定の手法と応用杉山将（東工大）

2重点サンプリング確率密度に関する期待値を，別の確率密度を用いて計算する統計手法

から標本を取るのが難しいとき，代わりに簡単な分布から標本を取る．

密度比

3本発表の構成

1. 密度比は，重点サンプリングだけでなく，様々な統計的データ解析に役立つ！

パターン認識，非定常環境下での適応学習，ドメイン適応，マルチタスク学習，異常値検出，時系列の変化点検知，特徴選択，次元削減，独立成分分析，条件付き確率推定，二標本検定など

2. 密度比推定の手法

3. 実験

4例：非定常環境下での適応学習

訓練データ

テストデータ

関数入力分布

学習したい関数

共変量シフト：訓練時とテスト時で入力分布が変化するが，入出力関数は不変

ロボット制御則の獲得

アンケートデータの学習

脳波，音声，言語データの学習

Shimodaira (JSPI2000)

5共変量シフト下での学習

通常の最小二乗法は一致性がない

密度比重み付きの最小二乗法は一致性がある

訓練誤差（尤度）に基づく学習法全てに適応可能！

Shimodaira (JSPI2000), Sugiyama & Müller (Stat&Deci2007), Sugiyama, Krauledat & Müller (JMLR2007)

6ドメイン適応とマルチタスク学習ドメイン適応：あるドメインでの学習結果を別のドメインでの学習に活用する

マルチタスク学習：複数の似た問題を同時に解くことにより，それぞれを解くよりも良い解を得る

同様な密度比重み付けによりうまく対応できる．

Tsuboi, Kashima, Hido, Bickel & Sugiyama (SDM2008)Storkey & Sugiyama (NIPS2006)

Bickel, Bogojeska, Lengauer & Scheffer (ICML2008)

一般会話医療文章

薬ＡによるHIV治療効果

薬BによるHIV治療効果

薬CによるHIV治療効果

−5 0 50

例：異常値検出

異常値検出：標本に含まれる異常値を見つける

生産ラインの不良品検出

ネットワークシステムへの不正侵入検出

文書集合からの新規トピック発見

確率密度の低い標本を異常値とみなす

異常値

−5 0 50

例：異常値検出（続き）

異常値は密度比が小さい

異常値

Hido, Tsuboi, Kashima & Sugiyama (ICDM2008)

9時系列の変化点検知

時系列の傾向が変化する点を検知する

密度比を逐次的に計算：

Kawahara & Sugiyama (IBIS2008)

時間

10例：特徴選択特徴選択：入出力関係で，

出力を最もよく説明する入力変数を選ぶ

遺伝子選択，脳の活動部位の特定，創薬など

−5 0 5−10

11相互情報量に基づく独立性判定

相互情報量：

相互情報量は密度比を用いて計算できる．

特徴選択，独立成分分析などに適用可

とは独立

相互情報量がゼロ

Suzuki, Sugiyama, Sese & Kanamori (FSDM2008)

12例：条件付き確率推定

回帰分析：条件付き期待値の推定法

条件付き分布が複雑なときは，回帰分析では情報不足

多峰性

非対称性

不等分散性

条件付き確率そのものを推定したい！

40 50 60 70 80 90 100

Weighting time [minutes]

13例：条件付き確率推定（続き）

条件付き確率は，密度比を用いて計算できる．

Sugiyama, Takeuchi, Suzuki, Kanamori & Hachiya (準備中)

14本発表の構成

2. 密度比推定の手法Kullback-Leibler Importance Estimation Procedure (KLIEP)Least-Squares Importance Fitting (LSIF)Unconstrained LSIF (uLSIF)

3. 実験

15密度比の推定

密度比が分かれば，色々な事ができる．

実用上は，密度比を標本から推定する必要がある．

ナイーブな方法：それぞれの密度を推定し，比を取る

16Vapnikの原理

密度を求めるよりも，密度比を求めるほうが易しい！

密度推定を経由せず，密度比を推定することにする．

ある問題を解くとき，その問題よりも難しい問題を途中段階で解いてはならない

が分かるが分かる

3. 実験

18Kullback-Leibler ImportanceEstimation Procedure (KLIEP)

線形密度比モデル：

からのKLダイバー

ジェンスを最小にするようにパラメータを学習

Sugiyama, Nakajima, Kashima, von Bünau & Kawanabe (NIPS2007)

（例：ガウスカーネル）

19KLIEP：解法

KL情報量の分解：

は確率密度：

定数

拘束条件

20KLIEP：解法（続き）

期待値を標本平均で近似すれば，

これは凸最適化問題なので，

勾配上昇

拘束充足

を繰り返せば大域的最適解に収束

最適解はスパース！

21KLIEP：収束性

パラメトリックの場合:

標本から学習したパラメータは，最適な値にのオーダーで収束

ノンパラメトリックの場合：

標本から学習した関数は，真の関数により少し遅いオーダーで収束（関数集合のブラケッティングナンバーに依存）

（少ない方の標本数）

Sugiyama, Suzuki, Nakajima, Kashima, von Bünau & Kawanabe (AISM2008)Nguyen, Wainwright & Jordan (NIPS2007)

22KLIEP：実行例

23KLIEP：モデル選択

ガウシアンの幅はどうやって決めればよいか？

交差確認法：

テスト標本を分割

全ての組み合わせに対して繰り返し，平均を出力

これにより，KLの不偏推定量が得られる

グループ1 グループ2 グループkグループk-1…密度比を推定尤度を確認

24KLIEP：尤度交差確認法の例

非常に精度が良い！

真のKL（定数項は除く）

交差確認法による推定値

25計算機実験の設定実験設定：ｄ次元データ，分散１の正規分布で平均は

訓練：（０，０，０，．．．，０）

テスト：（１，０，０，．．．，０）

カーネル密度推定(KDE)：訓練密度とテスト密度をそれぞれ推定

ガウシアンカーネルの幅は尤度交差確認法で決定

KLIEP：ガウシアンカーネルの幅は交差確認法で決定

KDE：次元が増えると誤差は単調に増加

KLIEP：高次元でも比較的うまくいく

次元が増えたときの精度比較

次元

27KLIEP：特徴

比較的高次元でも精度がよい（Vapnikの原理）

スパースな大域的最適解が求まる

交差確認法によりモデル選択ができる

分母と分子のドメインが異なってもいてもよい（相互情報量や条件付き確率の推定で重要）

ＫＬロスは，相互情報量（ＫＬダイバージェンス）推定と相性がよい

対数線形密度比モデルを用いれば，分子のデータが大量の場合でも効率よく計算できる

Tsuboi, Kashima, Hido, Bickel & Sugiyama (SDM2008)

3. 実験

29Least-Squares Importance Fitting(LSIF)

線形密度比モデル：

二乗損失：

（例：ガウスカーネル）

Kanamori, Hido & Sugiyama (NIPS2008)

30LSIF：解法

二乗損失の分解：

拘束条件：

定数

31LSIF：解法（続き）

期待値を標本平均で近似し，正則化項を加えれば

これは凸二次計画問題なので，標準的な二次計画ソルバーで大域的最適解が求まる

最適解はスパース！

32LSIF：正則化パス追跡

解は正則化パラメータに関して区分線形

全てのに対する解が効率よく計算できる！

33LSIF：実行例

正則化パス

正則化パラメータとカーネル幅は交差確認法で決定

34LSIF：特徴

二乗ロスは条件付き確率推定には都合が良い（裾はあまり気にしない）

正則化パスが計算できるため計算効率が良い

しかし，正則化パス計算は数値的にやや不安定

3. 実験

36Unconstrained LSIF (uLSIF)

LSIFを少し改変：

非負拘束を無視する

正則化項を２次にする

Kanamori, Hido & Sugiyama (NIPS2008)

37uLSIF：解法

解は解析的に計算できる！

無視した非負拘束は，事後補正する：

LSIFとuLSIFの解の差：

正則化パラメータが大きいとき，差が小さい

ガウス幅が大きいとき，差が小さい

38uLSIF：一つ抜き交差確認法

一つ抜き交差確認法：

通常はｎ回繰り返して計算する必要があるが，uLSIFでは解析的に一発で計算できる（Sherman-Woodbury-Morrison公式を使う）

モデル選択を含めた計算時間が飛躍的に短縮される！

標本1 標本2 標本n標本n-1

密度比を推定誤差を確認

39密度比推定法のまとめ

Kernel mean matching (KMM)

Logistic regression method (LogReg)

計算速度モデル選択

分子と分母のドメイン

密度推定手法

とても速いあり違っても良いなしuLSIF速いあり違っても良いなしLSIF

やや遅いあり違っても良いなしKLIEPやや遅いあり同じなしLogRegやや遅いなし同じなしKMM超速いあり違っても良いありKDE

Qin (Biometrica1998), Cheng & Chu (Bernoulli2004)Bickel, Brückner & Scheffer (ICML2007)

Huang, Smola, Gretton, Borgwardt & Schölkopf (NIPS2006)

3. 実験

共変量シフト適応

外れ値検出

特徴選択

条件付き確率推定

41共変量シフト適応：

ブレイン・コンピュータインターフェース

脳波(EEG)でコンピューターを操作する

入力は脳波，出力は左右の方向

分類規則をデータから学習する

Sugiyama, Krauledat & Müller (JMLR2007)

42訓練風景画面に現れる指示に従って，左手／右手を動かすイメージをする．

動画：ドイツFraunhofer研究所提供

43テスト風景左右の手を動かすイメージをすることにより，脳波でパッドを操作する

動画：ドイツFraunhofer研究所提供

44実験結果（識別誤差）

訓練時とテスト時で精神状態が異なるため，脳波の分布が変化．

KL：訓練・テスト入力分布

のＫＬ情報量の推定値

識別性能が向上密度比重み付き線形判別分析

密度比重み付き交差確認法

2.010.791.835.589.231.252.882.630.431.050.970.691.110.76

KL提案法従来法試行被験者

14.0 %15.3 %221.3 %21.3 %1

6.4 %6.4 %32.4 %2.4 %221.3 %21.3 %1

17.5 %22.5 %319.3 %21.3 %234.4 %36.9 %1

25.5 %25.5 %338.7 %39.3 %240.0 %40.0 %1

4.3 %4.3 %38.8 %8.8 %210.0 %9.3 %1

45共変量シフト適応：話者識別音声から話者を特定する．

音声データの分布は一定でない

マイクや部屋の特性

話者の心理状況

識別性能が向上

密度比重み付きロジスティック回帰

Yamada & Sugiyama (DMSS2008)

8.0 %16.1 %13.2 %

提案法(1.5s)

0.3 %7.3 %7.7 %

従来法(4.5s)

8.3 %18.0 %13.9 %

従来法(1.5s)

0.1 %6.3 %7.4 %

提案法(4.5s)

９ヵ月後

６ヵ月後

３ヵ月後

46共変量シフト適応：強化学習によるロボット制御

振り子ロボット

状態：振り子の角度，角速度

行動：左に加速，右に加速

ゴール：車を左右に動かして振り子を振り上げ，垂直な状態を維持する制御則を獲得

Hachiya, Akiyama, Sugiyama & Peters (AAAI2008)

47強化学習

強化学習：得られる報酬が最大になるように制御方策を学習

報酬：振り子の角度（振り子が上にあるほど報酬が大きい）

48強化学習における共変量シフト

価値関数：状態で行動を取り，その後に従って行動して得られる報酬和

方策反復法：

方策を更新すると，の分布が変わる！

現在の制御方策の価値関数を推定

制御方策を更新

49実験結果

識別性能が向上

密度比重み付き最小二乗法

10 20 30 40 50 60 70 80 90−15

Total number of episodes

ν=0ν=1ν= νIWCV

従来法１

従来法２

提案法得

られ

た報

酬和

方策反復数

50ドメイン適応：日本語単語分割

適応元データ：会話辞典の例文（例）こんな／失敗／は／ご／愛敬／だ／よ／．

適応先データ：医療マニュアル

（例）細胞膜には受容体があり、これによって細胞を識別することができます．

単語分割性能が向上密度比重み付き条件付き確率場(CRF)密度比重み付き交差確認法

Tsuboi, Kashima, Hido, Bickel & Sugiyama (submitted)

94.4394.4692.30Ｆ値

適応先ラベル有提案法従来法手法

3. 実験

外れ値検出

特徴選択

52異常値検出：USPS手書き数字

人間でも読みにくい数字がUSPSのテスト

データには含まれている！

５００００

４８４５４

53異常値検出：ハードディスク故障検出

Self-Monitoring And Reporting Technology (SMART)：ハートディスクの故障検知

LOFは近傍数をうまく決めれば性能が良いが，

モデル選択法がない

提案法はモデル選択ができる！

One-class SVM:LOF: Local outlier factor Breunig, Kriegel, Ng & Sander (SIGMOD2000)

Schölkopf, Platt, Shawe-Taylor,Smola & Williamson (NeCo2001)

One-classSVM 近傍数30近傍数5

0.9240.847

提案法

手法

54変化点検知：呼吸データ

密度比によって変化点が検知できている

Kawahara & Sugiyama (IBIS2008)

もとの時系列

密度比

3. 実験

外れ値検出

特徴選択

56特徴選択：イースト菌細胞の分類Suzuki, Sugiyama, Kanamori & Sese (BMC BIoinfomatics 2009)

KDE: Kernel density estimationKNN: k-nearest neighborEDGE: Edgeworth expansionPCC: Peason correlationKNN: k-nearest neighbor mehtodHSIC: Hilbert-Schmidt independence criterion

提案法

3. 実験

外れ値検出

特徴選択

58条件付き確率推定：ロボットの状態遷移推定

状態遷移確率：状態で行動をとったときの行き先の確率分布

Sugiyama, Takeuchi, Suzuki, Kanamori & Hachiya (in preparation)

Khereraロボット

状態：左右の赤外線センサの値

行動：左右のタイヤの回転速度

59条件付き確率推定：ロボットの状態遷移推定

相対対数尤度（大きいほうが良い）

00.781.02Khepera201.641.92振り子101.621.92振り子201.211.48平均

00.801.07Khepera1MDNKDE提案法データ

KDE: Kernel density estimationMDN: Mixture density network Bishop (TechRep1994)

60まとめ密度比推定：統計的データ処理の新しい枠組み

パターン認識，非定常環境下での適応学習，ドメイン適応，マルチタスク学習，異常値検出，時系列の変化点検知，特徴選択，次元削減，独立成分分析，条件付き確率推定，二標本検定など

密度比を直接推定する手法KLIEP, LSIF, uLSIF必要最小限の問題を解いている（Vapnikの原理）

様々な応用例

ブレイン・コンピュータインターフェース，ロボット制御，音声認識，自然言語，故障検知，バイオデータ解析

61関連書籍

Quiñonero-Candela, Sugiyama, Schwaighofer & Lawrence (Eds.), Dataset Shift in Machine Learning, MIT Press, 2008.

八谷大岳，杉山将

強くなるロボティック・ゲームプレイヤーの作り方，毎日コミュニケーションズ, 2008

IBIS2008 2008年10月29日～31日...

Documents

Transcript of IBIS2008 2008年10月29日～31日...

P4-011 S11b Suzaku XIS Calibration Status in 2012XIS1 ( PKS2155, RXJ1856, E0102 ) 20091201版 20120719版 柱密度 XIS1- Nitrogen 柱密度 視野中心からの半径 (arcmin) ＜改訂した

LENSTAR LS 900® を用いた眼内レンズ度数計算式の精度比較

Micro Motion ELITE コリオリ流量計・密度計...Micro Motion ELITE コリオリ流量計・密度計 ELITE コリオリ流量計は、複雑で要求の厳しい液体、気体、スラリーのアプリケーションにおいて優れた流量および密度計測性

TOMBOTM No.5520 「マキベエ 」高密度仕様

Micro Motion F シリーズコリオリ流量計・密度計...Micro Motion F シリーズ コリオリ流量計・密度計 Micro Motion F シリーズコリオリ流量計・密度計は、重要なプロセス制御での使用において優れた信頼性と卓越した流量・密

Technical-Report GaNエピタキシャル膜とALD薄膜 …...位密度を示す。界面準位密度の評価にはTerman法を用いた。横軸が界面準位のエネルギーを縦軸が各エネルギーにおける

自動走査式RI密度水分計...自動走査式RI密度水分計 AUTOMATED SCANNING RADIO ISOTOPE DENSITY METER SRDM-PWS30C 大容量測定／表面整形不要 表示付認証機器

高密度衛星風プロダクトの開発 Development …...気象衛星センター 技術報告第45号 2004年12月 る風データの追加算出を行っていた。高密度衛星風算

Physical methods for food analyses. Mehods 1) Densimetry( 密度法） 2) Refractometry （折光法） 3) Polarimetry （旋光法） 4) Colourimetric method （色度） 5) Viscosimetry.

2011年度ㄥ2012年3月期ㄦ - Omron2012/04/27 · ©Omron Corporation 3 連結損益計算書ㄹ2011年度ㄻ 2011年度 2011年度 ㄥ前回見通しㄦ 前回見通し 比ㆀ差

第5章 静磁場 - 京都大学syuji/lecture/08kisoB/ryuzo/kisoB… · 磁束密度Bとdsのなす角：θ F = I ds × B F = |F| = IB sinθds. 磁束密度の次元 [F] = [I][B][ds]

深度解密IEEE IEL数据库： 科研检索与学术投稿·±度解密IEEE IEL数据库... · 培训内容. ieee . 简介. iel . 数据库及. ieee xplore . 平台介绍. ieee

2. 高松市の現状と課題 - Takamatsu...8 2) 人口密度の分布 500mメッシュごとに、平成22(2010)年における人口密度の分布をみる と、中心市街地から木太・

精密ロックナットシリーズ - Machine...3 精密ロックナットラインナップ 特長 種類 ナットネジ面と端面を同時研磨加工し、 直角度管理された精密ロックナットです。

高圧法ポリエチレン技術 - ChemistryLDPEの概要 ポリエチレンには，製品密度から低密度品（0.915～ 0.925 g／cm 3）と高密度品（0.945～0.965 g／cm

Cisco 网络层加密的配置与故障排除：IPSec 和 ISAKMP - 第 2 部分 · 使用密钥加密，则必须使用相同的密钥解密已加密的数据块。因此，加密器和解密器必须使用

Vol.83 No.4 2010 新しい高密度記録技術 ──高Ku 磁 …...富士時報 Vol.83 No.4 2010 新しい高密度記録技術 ――高Ku磁性材料――特集 1 253（11）

来園者状況 - City of Sapporo · 2020. 12. 9. · 来園者状況 月別合計入園者数比較 ※夜間、後納分を含む。 累積グラフ 月計 25年度前年度比24年度

MAG/ER (Magnetometer / Electron Reflectometer)mosir/pub/2012/2012-02-13/01_s...2012/02/13 · ©NASA/NSSDC 火昙の密度 •半径: 3396km •質量: 6.42x10 23 kg •密度: 3930

P4-011 S11b Suzaku XIS Calibration Status in 2012XIS1 ( PKS2155, RXJ1856, E0102 ) 20091201版 20120719版柱密度 XIS1- Nitrogen 柱密度視野中心からの半径 (arcmin) ＜改訂した

TOMBOTM No.5520 「マキベエ」高密度仕様

Micro Motion F シリーズコリオリ流量計・密度計...Micro Motion F シリーズコリオリ流量計・密度計 Micro Motion F シリーズコリオリ流量計・密度計は、重要なプロセス制御での使用において優れた信頼性と卓越した流量・密

自動走査式RI密度水分計...自動走査式RI密度水分計 AUTOMATED SCANNING RADIO ISOTOPE DENSITY METER SRDM-PWS30C 大容量測定／表面整形不要表示付認証機器

高密度衛星風プロダクトの開発 Development …...気象衛星センター技術報告第45号 2004年12月る風データの追加算出を行っていた。高密度衛星風算

2011年度ㄥ2012年3月期ㄦ - Omron2012/04/27 · ©Omron Corporation 3 連結損益計算書ㄹ2011年度ㄻ 2011年度 2011年度ㄥ前回見通しㄦ前回見通し比ㆀ差

第5章静磁場 - 京都大学syuji/lecture/08kisoB/ryuzo/kisoB… · 磁束密度Bとdsのなす角：θ F = I ds × B F = |F| = IB sinθds. 磁束密度の次元 [F] = [I][B][ds]

深度解密IEEE IEL数据库：科研检索与学术投稿·±度解密IEEE IEL数据库... · 培训内容. ieee . 简介. iel . 数据库及. ieee xplore . 平台介绍. ieee

2. 高松市の現状と課題 - Takamatsu...8 2) 人口密度の分布 500mメッシュごとに、平成22(2010)年における人口密度の分布をみると、中心市街地から木太・

精密ロックナットシリーズ - Machine...3 精密ロックナットラインナップ特長種類ナットネジ面と端面を同時研磨加工し、直角度管理された精密ロックナットです。

高圧法ポリエチレン技術 - ChemistryLDPEの概要ポリエチレンには，製品密度から低密度品（0.915～ 0.925 g／cm 3）と高密度品（0.945～0.965 g／cm

来園者状況 - City of Sapporo · 2020. 12. 9. · 来園者状況月別合計入園者数比較 ※夜間、後納分を含む。累積グラフ月計 25年度前年度比24年度