Decomposição de Valor Singular (SVD) tutorial

Decomposição de Valor Singular (SVD) tutorial

BE.400 / 7.548

Descomposição de Valor Singular toma uma matriz retangular de dados de expressão gênica (definida como A, onde A é uma matriz n x p) na qual as n linhas representam os genes, e as colunas p representam as condições experimentais. Os estados do teorema SVD:

Anxp= Unxn Snxp VTpxp

Where

UTU = Inxn

VTV = Ipxp (ou sejaU e V são ortogonais)

WhWhWherethe colunas de U são os vectores singulares esquerdos (vectores de coeficiente genético); S (as mesmas dimensões que A) tem valores singulares e é diagonal (modo-amplitudes); e VT tem linhas que são os vectores singulares direitos (vectores de nível de expressão). O SVD representa uma expansão dos dados teoriginais em um sistema de coordenadas onde a matriz de covariância é diagonal.

Calculando o SVD consiste em desligar os autovalores e autovetores do AAT e ATA. Os autovetores do ATA compõem as colunas de V , os autovetores do AAT compõem as colunas de U. Além disso, estes valores em S são quadrados de autovalores do AATor ATA. Os valores singulares são as diagonentradas da matriz S e estão dispostos em ordem decrescente. Os valores do singular são sempre números reais. Se a matriz A é uma matriz real, então U e V também são reais.

>

Padrão de contorno como resolver para SVD, vamos tomar o exemplo da matriz que foi fornecida em Kuruvilla et al:

Neste exemplo a matriz é uma matriz 4×2.Sabemos que para uma matriz n x n W, então um vetor não-zero x é um vetor próprio de W if:

W x = l x

Para alguns escalares l. Thenthe scalar l é chamado de aneigenvalue de A, e x é dito ser um eigenvector de A correspondente a l.

> Então para encontrar os eigenvalues da entidade acima nós calculamos as matrizes AAT e ATA. Aspreviously stated ,os autovectores de AAT compõem as colunas de U assim que nós cando a seguinte análise para encontrar U.

Agora que nós temos uma matriz nx n nós podemos determinar os auto-valores da matriz W.

Desde W x = l x depois (W- lI) x = 0

Para que um único valor próprio seja determinante da matriz (W-lI) deve ser igual a zero. Assim da solução da caracterização, |W-lI|=0 obtemos:

l=0, l=0; l = 15+Ö221,5 ~ 29,883; l = 15-Ö221,5 ~ 0,117 (quatro autovalores uma vez que é o quarto degreepolinomial). Este valor pode ser usado para determinar o autovector que pode ser colocado nas colunas de U. Assim obtemos as seguintes equações:

19,883 x1 + 14 x2= 0

14 x1 + 9.883 x2 =0

x3 = 0

x4 = 0

Upão simplificando as duas primeiras equações obtemos uma razão que relaciona o valor de x1 com x2. Os valores de x1 e x2 são escolhidos de modo que os elementos do S sejam as raízes quadradas dos autovalores. Assim, uma solução que satisfaça a equação acima x1 = -0,58 e x2 = 0,82 e x3 = x4 = 0 (esta é a segunda coluna da Umatrix).

Substituindo o outro autovalor que obtemos:

-9,883×1 + 14 x2 = 0

14 x1 – 19.883 x2= 0

x3 = 0

x4 = 0

>Assim, uma solução que satisfaz este conjunto de frequências é x1 = 0,82 e x2 = -0,58 e x3 = x4 = 0 (esta é a primeira columno da matriz U). Combinando estas obtemos:

Similiarmente ATA compõe as colunas de V para que possamos doa análise semelhante para encontrar o valor de V.

e de forma semelhante obtemos a expressão:

>

Finalmente como mencionado anteriormente o S é a raiz quadrada dos autovalores da AATor ATA. e pode ser obtido diretamente nos dando:

Nota que: s1 > s2 > s3 > … que é o que o papel estava indicando pela figura 4 do papel Kuruvillapaper. Naquele papel os valores foram computados e normalizados de tal forma que o valor mais alto do singular era igual a 1.

Prova:

A=USVT e AT=VSUT

ATA = VSUTUSVT

ATA = VS2VT

ATAV = VS2

  • Alter O, Brown PO, Botstein D. (2000) Singular value decomposition for genome-wide expression data processing and modeling. Proc Natl Acad Scien U S A, 97, 10101-6.
  • Golub, G.H., e Van Loan, C.F. (1989) Matrix Computations, 2ª ed., G.H., e Van Loan, C.F. (1989) Matrix Computations, 2ª ed. (Baltimore: Johns Hopkins University Press).
  • Greenberg, M. (2001) Equações diferenciais & Álgebra linear (Upper Saddle River, N.J. : Prentice Hall).
  • Strang, G. (1998) Introduction to linear algebra (Wellesley, MA : Wellesley-Cambridge Press).

Deixe uma resposta

O seu endereço de email não será publicado.