うろ覚え正準相関分析まとめ

うろ覚え正準相関分析の定式化まとめ(変数群が2つの場合)

n:サンプルサイズ
m_x:変数群Xにおける変数の数
m_y:変数群Yにおける変数の数
p:正準変数の数

\mathbf{X}n \times m_xの列中心化(平均=0に)されたデータ行列
\mathbf{Y}n \times m_yの列中心化(平均=0に)されたデータ行列
\mathbf{A}m_x \times pの変数群\mathbf{X}についての正準係数行列
\mathbf{B}m_y \times pの変数群\mathbf{Y}についての正準係数行列

基本的制約
n^{-1}\mathbf{A'X'XA} = \mathbf{I}_p
n^{-1}\mathbf{B'Y'YB} = \mathbf{I}_p
これは
\mathbf{A^{*}}=\mathbf{XA} , \mathbf{B^{*}}=\mathbf{YB}
 \Leftrightarrow \mathbf{A}=\mathbf{(X'X)^{-1}X'A^{*}} ,  \mathbf{B}=\mathbf{(Y'Y)^{-1}Y'B^{*}}
と置くことにより
 \mathbf{A'^{*}A^{*}}=n \mathbf{I}_p
 \mathbf{B'^{*}B^{*}}=n \mathbf{I}_p
となる.

同時法(複数の正準変数を同時に求める方法)についてのみ記す.

SUMCOR(正準相関係数の和を最大化)

Maximize \mathrm{tr}n^{-1}(\mathbf{A'X'YB})
subject to 基本制約

 \Leftrightarrow Maximize \mathrm{tr}n^{-1}\{\mathbf{A'^{*}X(X'X)^{-1}X'Y(Y'Y)^{-1}Y'B^{*}}\}
subject to  \mathbf{A'^{*}A^{*}}=n \mathbf{I}_p , \mathbf{B'^{*}B^{*}}=n \mathbf{I}_p

これは結局特異値分解
 n^{-1}\{\mathbf{X(X'X)^{-1}X'Y(Y'Y)^{-1}Y'}\} = \mathbf{K \Lambda L'}
に帰結

HOMALS(等質性最小二乗基準の最適化)

minimize \mathrm{SS}(\mathbf{XA-YB}) subject to 基本制約

これは
\mathrm{SS}(\mathbf{XA-YB}) = \mathrm{tr}(\mathbf{XA-YB})'(\mathbf{XA-YB})
= \mathrm{tr}(\mathbf{A'X'XA}) - 2\mathrm{tr}(\mathbf{A'X'YB}) + \mathrm{tr}(\mathbf{B'Y'YB})
= \mathrm{(Const)} - 2\mathrm{tr}(\mathbf{A'X'YB})
となるから,SUMCOR基準と同一の解を与えることがわかる.