Decomposição de Valor Singular (SVD) tutorial
BE.400 / 7.548
Descomposição de Valor Singular toma uma matriz retangular de dados de expressão gênica (definida como A, onde A é uma matriz n x p) na qual as n linhas representam os genes, e as colunas p representam as condições experimentais. Os estados do teorema SVD:
Anxp= Unxn Snxp VTpxp
Where
UTU = Inxn
VTV = Ipxp (ou sejaU e V são ortogonais)
WhWhWherethe colunas de U são os vectores singulares esquerdos (vectores de coeficiente genético); S (as mesmas dimensões que A) tem valores singulares e é diagonal (modo-amplitudes); e VT tem linhas que são os vectores singulares direitos (vectores de nível de expressão). O SVD representa uma expansão dos dados teoriginais em um sistema de coordenadas onde a matriz de covariância é diagonal.
Calculando o SVD consiste em desligar os autovalores e autovetores do AAT e ATA. Os autovetores do ATA compõem as colunas de V , os autovetores do AAT compõem as colunas de U. Além disso, estes valores em S são quadrados de autovalores do AATor ATA. Os valores singulares são as diagonentradas da matriz S e estão dispostos em ordem decrescente. Os valores do singular são sempre números reais. Se a matriz A é uma matriz real, então U e V também são reais.
>
Padrão de contorno como resolver para SVD, vamos tomar o exemplo da matriz que foi fornecida em Kuruvilla et al:
Neste exemplo a matriz é uma matriz 4×2.Sabemos que para uma matriz n x n W, então um vetor não-zero x é um vetor próprio de W if:
W x = l x
Para alguns escalares l. Thenthe scalar l é chamado de aneigenvalue de A, e x é dito ser um eigenvector de A correspondente a l.
> Então para encontrar os eigenvalues da entidade acima nós calculamos as matrizes AAT e ATA. Aspreviously stated ,os autovectores de AAT compõem as colunas de U assim que nós cando a seguinte análise para encontrar U.
Agora que nós temos uma matriz nx n nós podemos determinar os auto-valores da matriz W.
Desde W x = l x depois (W- lI) x = 0
Para que um único valor próprio seja determinante da matriz (W-lI) deve ser igual a zero. Assim da solução da caracterização, |W-lI|=0 obtemos:
l=0, l=0; l = 15+Ö221,5 ~ 29,883; l = 15-Ö221,5 ~ 0,117 (quatro autovalores uma vez que é o quarto degreepolinomial). Este valor pode ser usado para determinar o autovector que pode ser colocado nas colunas de U. Assim obtemos as seguintes equações:
19,883 x1 + 14 x2= 0
14 x1 + 9.883 x2 =0
x3 = 0
x4 = 0
Upão simplificando as duas primeiras equações obtemos uma razão que relaciona o valor de x1 com x2. Os valores de x1 e x2 são escolhidos de modo que os elementos do S sejam as raízes quadradas dos autovalores. Assim, uma solução que satisfaça a equação acima x1 = -0,58 e x2 = 0,82 e x3 = x4 = 0 (esta é a segunda coluna da Umatrix).
Substituindo o outro autovalor que obtemos:
-9,883×1 + 14 x2 = 0
14 x1 – 19.883 x2= 0
x3 = 0
x4 = 0
>Assim, uma solução que satisfaz este conjunto de frequências é x1 = 0,82 e x2 = -0,58 e x3 = x4 = 0 (esta é a primeira columno da matriz U). Combinando estas obtemos:
Similiarmente ATA compõe as colunas de V para que possamos doa análise semelhante para encontrar o valor de V.
e de forma semelhante obtemos a expressão:
>
Finalmente como mencionado anteriormente o S é a raiz quadrada dos autovalores da AATor ATA. e pode ser obtido diretamente nos dando:
Nota que: s1 > s2 > s3 > … que é o que o papel estava indicando pela figura 4 do papel Kuruvillapaper. Naquele papel os valores foram computados e normalizados de tal forma que o valor mais alto do singular era igual a 1.
Prova:
A=USVT e AT=VSUT
ATA = VSUTUSVT
ATA = VS2VT
ATAV = VS2
- Alter O, Brown PO, Botstein D. (2000) Singular value decomposition for genome-wide expression data processing and modeling. Proc Natl Acad Scien U S A, 97, 10101-6.
- Golub, G.H., e Van Loan, C.F. (1989) Matrix Computations, 2ª ed., G.H., e Van Loan, C.F. (1989) Matrix Computations, 2ª ed. (Baltimore: Johns Hopkins University Press).
- Greenberg, M. (2001) Equações diferenciais & Álgebra linear (Upper Saddle River, N.J. : Prentice Hall).
- Strang, G. (1998) Introduction to linear algebra (Wellesley, MA : Wellesley-Cambridge Press).