Tutorial de descompunere a valorilor singulare (SVD)

Tutorial de descompunere a valorilor singulare (SVD)

BE.400 / 7.548

Descompunerea valorilor singulare ia o matrice dreptunghiulară de date de expresie genetică (definită ca A, unde A este o matrice n x p) în care cele n rânduri reprezintă genele, iar cele p coloane reprezintă condițiile experimentale. Teorema SVD afirmă:

Anxp= Unxn Snxp VTpxp

Unde

UTU = Inxn

VTV = Ipxp (adică.U și V sunt ortogonale)

Unde coloanele lui U sunt vectorii singulari din stânga (vectorii de coeficienți genetici);S (aceleași dimensiuni ca și A) are valori singulare și este diagonală (modulamplitudini); și VT are rânduri care sunt vectorii singulari din dreapta (vectorii nivelului de expresie). SVD reprezintă o expansiune a datelor originale într-un sistem de coordonate în care matricea de covarianță este diagonală.

Calcularea SVD constă în găsirea valorilor proprii și a vectorilor proprii ai AAT și ATA.Vectorii proprii ai ATA alcătuiesc coloanele din V, iar vectorii proprii ai AAT alcătuiesc coloanele din U. De asemenea, valorile singulare din S sunt rădăcinile pătrate ale valorilor proprii din AAT sau ATA. Valorile singulare reprezintă punctele diagonale ale matricei S și sunt aranjate în ordine descrescătoare. Valorile singulare sunt întotdeauna numere reale. Dacă matricea A este o matrice reală, atunci Uși V sunt, de asemenea, reale.

Pentru a înțelege cum se rezolvă SVD, să luăm exemplul matricei care a fostfurnizat în Kuruvilla et al:

În acest exemplu matricea este o matrice 4×2.Știm că pentru o matrice n x n W, atunci un vector nenule x este vectorul propriu al lui W dacă:

W x = l x

Pentru un anumit scalar l. Atunci scalarul l se numește o valoare proprie a lui A, iar x se spune că este un vector propriu al lui A corespunzător lui l.

Atunci pentru a găsi valorile proprii ale entității de mai sus calculăm matricile AAT și ATA. Așa cum am precizat anterior ,vectorii proprii ai AAT alcătuiesc coloanele lui U deci putem face următoarea analiză pentru a găsi U.

Acum că avem o matrice nx n putem determina valorile proprii ale matricei W.

Din moment ce W x = l x atunci (W- lI) x = 0

Pentru o serie unică de valori proprii determinantul matricei (W-lI) trebuie să fie egal cu zero. Astfel, din soluția ecuației caracteristice, |W-lI|=0 obținem:

l=0, l=0; l = 15+Ö221.5 ~ 29.883; l = 15-Ö221.5 ~ 0.117 (patru valori proprii deoarece este un polinom de gradul patru). Această valoare poate fi folosită pentru a determinavectorul propriu care poate fi plasat în coloanele lui U. Astfel, obținem următoarele ecuații:

19.883 x1 + 14 x2= 0

14 x1 + 9.883 x2 =0

x3 = 0

x4 = 0

Simplificând primele două ecuații obținem un raport care leagă valoarea lui x1 de x2. Valorile lui x1 și x2 sunt alese astfel încât elementele lui S să fie rădăcinile pătrate ale valorilor proprii. Astfel, o soluție care satisface ecuația de mai susx1 = -0,58 și x2 = 0,82 și x3 = x4 = 0 (aceasta este a doua coloană a Umatrix).

Substituind cealaltă valoare proprie obținem:

-9,883×1 + 14 x2 = 0

14 x1 – 19.883 x2= 0

x3 = 0

x4 = 0

Atunci o soluție care satisface acest set de ecuații este x1 = 0,82 și x2 = -0,58 și x3 = x4 = 0 (aceasta este prima coloană a matricei U). Combinând acestea obținem:

În mod similar, ATA alcătuiește coloanele lui V, astfel încât putem face o analiză similară pentru a găsi valoarea lui V.

și în mod similar obținem expresia:

În cele din urmă, așa cum am menționat anterior, S este rădăcina pătrată a valorilor proprii din AAT sau ATA. și poate fi obținutădirect dându-ne:

Rețineți că: s1 > s1 > s2 > s3 > … ceea ce este ceea ce indica lucrarea prin figura 4 din Kuruvillapaper. În acea lucrare, valorile au fost calculate și normalizate astfel încât cea mai mare valoare singulară să fie egală cu 1.

Probă:

A=USVT și AT=VSUT

ATA = VSUTUSVT

ATA = VS2VT

ATAV = VS2

  • Alter O, Brown PO, Botstein D. (2000) Descompunerea valorii singulare pentru procesarea și modelarea datelor de expresie la nivelul întregului genom. Proc Natl Acad Sci U S A, 97, 10101-6.
  • Golub, G.H., și Van Loan, C.F. (1989) Matrix Computations, 2nd ed. (1989). (Baltimore: Johns Hopkins University Press).
  • Greenberg, M. (2001) Differential equations & Linear algebra (Upper Saddle River, N.J. : Prentice Hall).
  • Strang, G. (1998) Introducere în algebra liniară (Wellesley, MA : Wellesley-Cambridge Press).

Lasă un răspuns

Adresa ta de email nu va fi publicată.