Singular Value Decomposition (SVD) tutorial

Singular Value Decomposition (SVD) tutorial

BE.400 / 7.548

特異値分解は、遺伝子発現データ(Aとして定義、Aはn×p行列)を、n行は遺伝子、p列は実験条件である長方行列とし、この行とp列の間の値を特異値として表現し、Singular Value Decomposition(SVD)とする。 SVD定理は以下の通りである:

Anxp= Unxn Snxp VTpxp

ここで

UTU = Inxn

VTV = Ipxp (すなわち、.UとVは直交する)

ここで、Uの列は左特異ベクトル(遺伝子係数ベクトル)、S(Aと同じ次元)は特異値を持ち対角(モード振幅)、VTは右特異ベクトル(発現量ベクトル)の行がある。 SVDは共分散行列が対角である座標系での元のデータの展開を表す。

SVDの計算はAATとATAの固有値と固有ベクトルを求めることからなる。ATAの固有ベクトルはVの列を構成し、AATの固有ベクトルはUの列を構成する。またS中の正則値はAATまたはATAからの固有値の平方根になる。 特異値は S 行列の対角成分であり、降順に並べられます。 特異値は常に実数です。 行列 A が実数行列の場合、U と V も実数です。

SVDの解き方を理解するために、Kuruvilla et al:

この例では行列は4×2行列である。我々は、n×nの行列Wについて、非ゼロベクトルxは次の場合にWの固有ベクトルであることを知っている:

W x = l x

あるスカラーlについて。そのスカラーlをAの固有値と呼び、xはlに対応するAの固有ベクトルであると言う。

だから上記の実数の固有値を求めるために我々は行列AATおよびATAを計算する。 前述したように、AATの固有ベクトルはUの列を構成するので、Uを求めるために以下の解析を行う。

nx nの行列があるので、行列Wの固有値を決定することができる。

Since W x = l x then (W- lI) x = 0

固有値のセットがユニークであれば、行列式は (W-lI) 0に等しいはずです。 したがって、特性方程式の解から、|W-lI|=0が得られる:

l=0, l=0; l = 15+Ö221.5 ~ 29.883; l = 15-Ö221.5 ~ 0.117 (4次の多項式なので4つの固有値). この値を用いて、Uの列に配置できる固有ベクトルを決定することができる。したがって、次の方程式が得られる。883 x2 = 0

x3 = 0

x4 = 0

最初の二つの方程式を単純化すると、x1とx2の値を関連付ける比率が得られる。 x1とx2の値はSの要素が固有値の平方根になるように選ばれる。 したがって、上の式x1 = -0.58 and x2 = 0.82 and x3 = x4 = 0を満たす解(これはUmatrixの2列目である)。

他の固有値を代入すると:

-9.883×1 + 14 x2 = 0

14 x1 – 19.82となります。883 x2= 0

x3 = 0

x4 = 0

したがって、この一連の方程式を満たす解は x1 = 0.82 と x2 = -0.58 と x3 = x4 = 0 です(これは U行列の1列目です)。 これらを組み合わせると次のようになります。

同様にATAはVの列を構成するので、同様の分析を行ってVの値を求めることができます。

となり、同様に

最後に前述のようにSはAATまたはATAからの固有値の平方根となる。 これは、Kuruvillapaperの図4で示されていることである。 その論文では、最も高い特異値が1になるように値が計算され、正規化されている。

証明:

A=USVT and AT=VSUT

ATA = VSUTUSVT

ATA = VS2VT

ATAV = VS2

  • Alter O, Brown PO, Botstein D. (2000) Singular value decomposition for genome-wide expression data processing and modeling. Proc Natl Acad Sci U S A, 97, 10101-6.
  • Golub, G.H., and Van Loan, C.F. (1989) Matrix Computations, 2nd ed. (1989) Matrix Computations, 2nd ed. (1989) Matrix Computations, 2nd ed. (1989) Matrix Computations. (Baltimore: Johns Hopkins University Press).
  • Greenberg, M. (2001) Differential equations & Linear algebra (Upper Saddle River, N.J. : Prentice Hall).
  • Strang, G. (1998) Introduction to Linear Algeon (Wellesley, MA : Wellesley-Cambridge Press)。

コメントを残す

メールアドレスが公開されることはありません。