Tutorial de descompunere a valorilor singulare (SVD)
BE.400 / 7.548
Descompunerea valorilor singulare ia o matrice dreptunghiulară de date de expresie genetică (definită ca A, unde A este o matrice n x p) în care cele n rânduri reprezintă genele, iar cele p coloane reprezintă condițiile experimentale. Teorema SVD afirmă:
Anxp= Unxn Snxp VTpxp
Unde
UTU = Inxn
VTV = Ipxp (adică.U și V sunt ortogonale)
Unde coloanele lui U sunt vectorii singulari din stânga (vectorii de coeficienți genetici);S (aceleași dimensiuni ca și A) are valori singulare și este diagonală (modulamplitudini); și VT are rânduri care sunt vectorii singulari din dreapta (vectorii nivelului de expresie). SVD reprezintă o expansiune a datelor originale într-un sistem de coordonate în care matricea de covarianță este diagonală.
Calcularea SVD constă în găsirea valorilor proprii și a vectorilor proprii ai AAT și ATA.Vectorii proprii ai ATA alcătuiesc coloanele din V, iar vectorii proprii ai AAT alcătuiesc coloanele din U. De asemenea, valorile singulare din S sunt rădăcinile pătrate ale valorilor proprii din AAT sau ATA. Valorile singulare reprezintă punctele diagonale ale matricei S și sunt aranjate în ordine descrescătoare. Valorile singulare sunt întotdeauna numere reale. Dacă matricea A este o matrice reală, atunci Uși V sunt, de asemenea, reale.
Pentru a înțelege cum se rezolvă SVD, să luăm exemplul matricei care a fostfurnizat în Kuruvilla et al:
În acest exemplu matricea este o matrice 4×2.Știm că pentru o matrice n x n W, atunci un vector nenule x este vectorul propriu al lui W dacă:
W x = l x
Pentru un anumit scalar l. Atunci scalarul l se numește o valoare proprie a lui A, iar x se spune că este un vector propriu al lui A corespunzător lui l.
Atunci pentru a găsi valorile proprii ale entității de mai sus calculăm matricile AAT și ATA. Așa cum am precizat anterior ,vectorii proprii ai AAT alcătuiesc coloanele lui U deci putem face următoarea analiză pentru a găsi U.
Acum că avem o matrice nx n putem determina valorile proprii ale matricei W.
Din moment ce W x = l x atunci (W- lI) x = 0
Pentru o serie unică de valori proprii determinantul matricei (W-lI) trebuie să fie egal cu zero. Astfel, din soluția ecuației caracteristice, |W-lI|=0 obținem:
l=0, l=0; l = 15+Ö221.5 ~ 29.883; l = 15-Ö221.5 ~ 0.117 (patru valori proprii deoarece este un polinom de gradul patru). Această valoare poate fi folosită pentru a determinavectorul propriu care poate fi plasat în coloanele lui U. Astfel, obținem următoarele ecuații:
19.883 x1 + 14 x2= 0
14 x1 + 9.883 x2 =0
x3 = 0
x4 = 0
Simplificând primele două ecuații obținem un raport care leagă valoarea lui x1 de x2. Valorile lui x1 și x2 sunt alese astfel încât elementele lui S să fie rădăcinile pătrate ale valorilor proprii. Astfel, o soluție care satisface ecuația de mai susx1 = -0,58 și x2 = 0,82 și x3 = x4 = 0 (aceasta este a doua coloană a Umatrix).
Substituind cealaltă valoare proprie obținem:
-9,883×1 + 14 x2 = 0
14 x1 – 19.883 x2= 0
x3 = 0
x4 = 0
Atunci o soluție care satisface acest set de ecuații este x1 = 0,82 și x2 = -0,58 și x3 = x4 = 0 (aceasta este prima coloană a matricei U). Combinând acestea obținem:
În mod similar, ATA alcătuiește coloanele lui V, astfel încât putem face o analiză similară pentru a găsi valoarea lui V.
și în mod similar obținem expresia:
În cele din urmă, așa cum am menționat anterior, S este rădăcina pătrată a valorilor proprii din AAT sau ATA. și poate fi obținutădirect dându-ne:
Rețineți că: s1 > s1 > s2 > s3 > … ceea ce este ceea ce indica lucrarea prin figura 4 din Kuruvillapaper. În acea lucrare, valorile au fost calculate și normalizate astfel încât cea mai mare valoare singulară să fie egală cu 1.
Probă:
A=USVT și AT=VSUT
ATA = VSUTUSVT
ATA = VS2VT
ATAV = VS2
- Alter O, Brown PO, Botstein D. (2000) Descompunerea valorii singulare pentru procesarea și modelarea datelor de expresie la nivelul întregului genom. Proc Natl Acad Sci U S A, 97, 10101-6.
- Golub, G.H., și Van Loan, C.F. (1989) Matrix Computations, 2nd ed. (1989). (Baltimore: Johns Hopkins University Press).
- Greenberg, M. (2001) Differential equations & Linear algebra (Upper Saddle River, N.J. : Prentice Hall).
- Strang, G. (1998) Introducere în algebra liniară (Wellesley, MA : Wellesley-Cambridge Press).