固有値解析 (確率過程の場合:Karhunen-Loeve expansion) |
もっともポピュラーな確定的信号の直交展開としてフーリエ級数展開が挙げられます。 有限区間 [0, T] における信号をフーリエ級数展開した結果が次のようになったとします。 各周波数の係数の大きさ は、とりもなおさず、信号 に含まれる周波数成分の電力を表しています。 では、このような信号が確率的に放出されるシステムをイメージしてみましょう。 例えば、いろんな人が「ア〜〜」と発声した信号をいっぱい集めます。 すると、「ア〜〜」の周波数成分の大きさは、全部の「ア〜〜」の周波数成分の大きさの平均値と考えるのが自然ですね。 このような意味合いの展開を行うのが Karhunen-Loeve expansion と呼ばれているものです。 実は、この展開は、このハイパーテキストのあちこちで自然な形で使われています(たとえば、最大事後確率判定法)。 また、画像工学でもごく普通に応用されています。 時系列の場合は自己相関行列、画像の場合は画像パターンの共分散行列を求め、固有値が大きい固有ベクトルを選択して、それらを基底とする部分空間へパターンを射影して特徴抽出を行います。 以下、実信号について説明します。 フーリエ級数展開と同様に、十分長い有限区間 [0, T] をとり、最小にすべき汎関数を次のように定義します。 ここで、 を確率過程とし、 は正規直交関数系であり、 は集合平均(期待値)を意味します。 まず、下記は計算で用いる直交条件と展開係数 の式です。 これらを使って、式(1)を展開していきます。 第1項は信号電力なので一定値であり、第2項を最大にすればよい。 に関する最適化は、各 n について共通に、次のように書けます。 ここで、確率過程 を、 が時間差だけに関係し、 の形で書けるように広げます。 これを「弱定常」と呼んでいます。 を、制約条件 のもとで、最大化せよ。 この変分問題を解くと次が得られ(変分法を参照)、これを Karhunen - Loeve 展開と呼んでいます。 最適解は下の積分方程式の解である。 ここで は固有値、 は固有関数です。 なお、 の両辺と の内積をとると、 さらに、 なので、展開係数の間に次の無相関性が成立していることがいえます。 離散信号に対して数値計算する場合は、式(7)は行列の固有値と固有ベクトルを求める問題に帰着します。 なお、自己相関行列は対称(複素信号ではエルミート)なので、固有値は正で、N が大きいときは、電力スペクトルのサンプル値を近似します(自己相関行列を参照)。 現実の応用では、一応、エルゴード性を前提として集合平均を時間平均で代用します。 要するに、有限個のサンプル値で上のストーリーを近似することになります。 たとえば、 のような近似になるわけです。 時系列パターンの特徴抽出 (同じクラスの多数の見本パターンを固有空間に射影して典型パターンを決める作業) を例にとれば、見本パターンの個数は K に相当し、N<K で自己相関を求めるのが普通です。 もし、N>K ならば、自己相関行列のランクは K 以下になります。 N=64 とすれば、64×64 行列の固有値分解することになり、大きな固有値に相当する固有ベクトルを選んで、その部分空間で特徴抽出の作業を行うことになりす。 この程度なら、なんとか数値計算可能です。 しかし、画像では、ピクセル数=64×64=4096 ( =L ) 程度を扱うことになり、4096×4096 の共分散行列の固有値解析が必要になります。 これを避けるために K<<N とすると、ランクが K 以下の行列を扱うことになり、適当な K を選んで、 K 次元以下の固有空間にパターンを射影すれば済むはずです。 この方法を、”snapshots” と呼んでいます。 概略は次のようです。 まず、上の通常処理を整理すると次のようです。 画像の走査データ(長さ L=N×N ) の K 個のパターンを並べた L 行 K 列のパターン行列 (snapshots の場合は K<L ) を作る。 行列の各要素から全データの平均値を差し引いた行列 を作る。 共分散行列 を作る。 このサイズが L×L となり、固有値解析不能な大きさになってしまう。 これを避けるために次の定理を利用します(最小2乗法を参照)。 定理それ自身が snapshots の方法を与えています。 定理 |