固有値解析    (確率過程の場合:Karhunen-Loeve expansion)

 もっともポピュラーな確定的信号の直交展開としてフーリエ級数展開が挙げられます。 有限区間 [0, T] における信号をフーリエ級数展開した結果が次のようになったとします。

各周波数の係数の大きさ は、とりもなおさず、信号 に含まれる周波数成分の電力を表しています。 では、このような信号が確率的に放出されるシステムをイメージしてみましょう。 例えば、いろんな人が「ア〜〜」と発声した信号をいっぱい集めます。 すると、「ア〜〜」の周波数成分の大きさは、全部の「ア〜〜」の周波数成分の大きさの平均値と考えるのが自然ですね。 このような意味合いの展開を行うのが Karhunen-Loeve expansion と呼ばれているものです。 実は、この展開は、このハイパーテキストのあちこちで自然な形で使われています(たとえば、最大事後確率判定法)。 また、画像工学でもごく普通に応用されています。 時系列の場合は自己相関行列、画像の場合は画像パターンの共分散行列を求め、固有値が大きい固有ベクトルを選択して、それらを基底とする部分空間へパターンを射影して特徴抽出を行います。 以下、実信号について説明します。

フーリエ級数展開と同様に、十分長い有限区間 [0, T] をとり、最小にすべき汎関数を次のように定義します。

ここで、確率過程とし、 は正規直交関数系であり、 は集合平均(期待値)を意味します。 まず、下記は計算で用いる直交条件と展開係数 の式です。

これらを使って、式(1)を展開していきます。

第1項は信号電力なので一定値であり、第2項を最大にすればよい。  に関する最適化は、各 n について共通に、次のように書けます。 ここで、確率過程 を、 が時間差だけに関係し、 の形で書けるように広げます。 これを「弱定常」と呼んでいます。

を、制約条件

のもとで、最大化せよ。

この変分問題を解くと次が得られ(変分法を参照)、これを Karhunen - Loeve 展開と呼んでいます。

最適解は下の積分方程式の解である。

ここで は固有値、 は固有関数です。 なお、

の両辺と の内積をとると、

さらに、

なので、展開係数の間に次の無相関性が成立していることがいえます。

離散信号に対して数値計算する場合は、式(7)は行列の固有値と固有ベクトルを求める問題に帰着します。 なお、自己相関行列は対称(複素信号ではエルミート)なので、固有値は正で、N が大きいときは、電力スペクトルのサンプル値を近似します(自己相関行列を参照)。 現実の応用では、一応、エルゴード性を前提として集合平均を時間平均で代用します。 要するに、有限個のサンプル値で上のストーリーを近似することになります。 たとえば、

のような近似になるわけです。 時系列パターンの特徴抽出 (同じクラスの多数の見本パターンを固有空間に射影して典型パターンを決める作業) を例にとれば、見本パターンの個数は K に相当し、N<K で自己相関を求めるのが普通です。 もし、N>K ならば、自己相関行列のランクは K 以下になります。 N=64 とすれば、64×64 行列の固有値分解することになり、大きな固有値に相当する固有ベクトルを選んで、その部分空間で特徴抽出の作業を行うことになりす。 この程度なら、なんとか数値計算可能です。 しかし、画像では、ピクセル数=64×64=4096 ( =L ) 程度を扱うことになり、4096×4096 の共分散行列の固有値解析が必要になります。 これを避けるために K<<N とすると、ランクが K 以下の行列を扱うことになり、適当な を選んで、 次元以下の固有空間にパターンを射影すれば済むはずです。 この方法を、”snapshots” と呼んでいます。 概略は次のようです。

まず、上の通常処理を整理すると次のようです。 画像の走査データ(長さ L=N×N ) の 個のパターンを並べた 列のパターン行列 snapshots の場合は K<L ) を作る。 行列の各要素から全データの平均値を差し引いた行列 を作る。 共分散行列 を作る。 このサイズが L×L となり、固有値解析不能な大きさになってしまう。 これを避けるために次の定理を利用します(最小2乗法を参照)。 定理それ自身が snapshots の方法を与えています。

定理
  のランクは等しく、
非ゼロ固有値は一致する。
後者の固有ベクトルを とすると、 は前者の非負固有ベクトルを与えている。