Există mai multe moduri diferite de a estima o funcție de supraviețuire sau o curbă de supraviețuire. Există o serie de metode parametrice populare care sunt utilizate pentru a modela datele de supraviețuire, iar acestea diferă în ceea ce privește ipotezele care se fac cu privire la distribuția timpilor de supraviețuire în populație. Printre distribuțiile populare se numără distribuțiile exponențială, Weibull, Gompertz și log-normală.2 Poate că cea mai populară este distribuția exponențială, care presupune că probabilitatea ca un participant să sufere evenimentul de interes este independentă de perioada de timp în care persoana respectivă nu a suferit niciun eveniment. Alte distribuții formulează diferite ipoteze cu privire la probabilitatea ca o persoană să dezvolte un eveniment (de exemplu, aceasta poate crește, scădea sau se poate schimba în timp). Mai multe detalii despre metodele parametrice de analiză a supraviețuirii pot fi găsite în Hosmer și Lemeshow și Lee și Wang1,3.
Ne concentrăm aici pe două metode neparametrice, care nu fac nicio presupunere cu privire la modul în care probabilitatea ca o persoană să dezvolte evenimentul se schimbă în timp. Cu ajutorul metodelor neparametrice, estimăm și reprezentăm grafic distribuția de supraviețuire sau curba de supraviețuire. Curbele de supraviețuire sunt adesea reprezentate grafic ca funcții în trepte, așa cum se arată în figura de mai jos. Timpul este indicat pe axa X, iar supraviețuirea (proporția de persoane la risc) este indicată pe axa Y. Rețineți că procentul participanților care supraviețuiesc nu reprezintă întotdeauna procentul celor care sunt în viață (ceea ce presupune că rezultatul de interes este decesul). “Supraviețuirea” se poate referi, de asemenea, la proporția celor care nu prezintă un alt eveniment de rezultat (de exemplu, procentajul celor care nu au suferit un infarct miocardic sau o boală cardiovasculară) sau poate reprezenta, de asemenea, procentajul celor care nu prezintă un rezultat sănătos (de exemplu, remisiunea cancerului).
Funcția de supraviețuire
Observați că probabilitatea de supraviețuire este de 100% timp de 2 ani și apoi scade la 90%. Mediana supraviețuirii este de 9 ani (adică 50% din populație supraviețuiește 9 ani; a se vedea liniile punctate).
Exemplu:
Considerați un mic studiu de cohortă prospectiv conceput pentru a studia timpul până la deces. Studiul implică 20 de participanți care au vârsta de 65 de ani sau mai mult; aceștia sunt înrolați pe o perioadă de 5 ani și sunt urmăriți timp de până la 24 de ani până când mor, studiul se încheie sau abandonează studiul (lost to follow-up). Datele sunt prezentate mai jos. În cadrul studiului, există 6 decese și 3 participanți cu urmărire completă (adică 24 de ani). Restul de 11 au mai puțin de 24 de ani de urmărire din cauza înscrierii târzii sau a pierderii de urmărire.
Numărul de identificare al participantului |
Anul decesului |
Anul ultimului contact |
|
---|---|---|---|
1 |
|
24 |
24 |
2 |
3 |
|
|
3 |
|
11 |
|
4 |
|
19 |
|
5 |
|
24 |
|
6 |
|
13 |
|
7 |
14 |
|
|
8 |
|
2 |
|
9 |
|
18 |
|
10 |
|
17 |
|
11 |
|
24 |
|
12 |
|
21 |
|
13 |
|
12 |
|
14 |
1 |
|
|
15 |
|
10 |
|
16 |
23 |
|
|
17 |
|
6 |
|
18 |
5 |
|
|
19 |
|
9 |
|
20 |
17 |
|
Tablă de viață (tabel actuarial)
Un mod de a rezuma experiențele participanților este cu ajutorul unei tabele de viață, sau un tabel actuarial. Tabelele de viață sunt adesea folosite în industria asigurărilor pentru a estima speranța de viață și pentru a stabili primele. Ne concentrăm pe un anumit tip de tabel de viață utilizat pe scară largă în analiza biostatistică, numit tabel de viață de cohortă sau tabel de viață de urmărire. Tabelul de viață de urmărire rezumă experiențele participanților pe parcursul unei perioade de urmărire predefinite într-un studiu de cohortă sau într-un studiu clinic până la momentul evenimentului de interes sau până la sfârșitul studiului, oricare dintre acestea are loc mai întâi.
Pentru a construi un tabel de viață, mai întâi organizăm timpii de urmărire în intervale de timp egal distanțate. În tabelul de mai sus, avem o urmărire maximă de 24 de ani și luăm în considerare intervale de 5 ani (0-4, 5-9, 10-14, 15-19 și 20-24 de ani). Însumăm numărul de participanți care sunt în viață la începutul fiecărui interval, numărul celor care mor și numărul celor care sunt cenzurați în fiecare interval.
Intervalul în ani |
Numărul de participanți în viață la începutul intervalului |
Numărul de decese în timpul intervalului |
Numărul cenzurat |
---|---|---|---|
0-4 |
20 |
2 |
1 |
5-9 |
17 |
1 |
2 |
10-14 |
14 |
1 |
4 |
15-19 |
9 |
1 |
3 |
20-24 |
5 |
1 |
4 |
Utilizăm următoarea notație în analiza tabelului nostru de viață. Mai întâi definim notația și apoi o folosim pentru a construi tabelul de viață.
- Nt = numărul de participanți care nu au evenimente și care sunt considerați la risc în timpul intervalului t (de ex, în acest exemplu, numărul de participanți în viață, deoarece rezultatul nostru de interes este moartea)
- Dt = numărul de participanți care mor (sau suferă evenimentul de interes) în timpul intervalului t
- Ct = numărul de participanți care sunt cenzurați în timpul intervalului t Nt* = numărul mediu de participanți la risc în timpul intervalului t
- Nt* = numărul mediu de participanți la risc în timpul intervalului t [La construirea tabelelor de viață actuariale, se fac adesea următoarele ipoteze: În primul rând, se presupune că evenimentele de interes (de exemplu, decesele) se produc la sfârșitul intervalului și se presupune că evenimentele cenzurate se produc în mod uniform (sau uniform) de-a lungul intervalului. Prin urmare, se face adesea o ajustare la Nt pentru a reflecta numărul mediu de participanți la risc în timpul intervalului, Nt*, care se calculează după cum urmează: Nt* =Nt-Ct/2 (adică, scădem jumătate din evenimentele cenzurate).
- qt = proporția care moare (sau suferă un eveniment) în timpul intervalului t, qt = Dt/Ntt*
- pt = proporția care supraviețuiește (rămâne fără evenimente) în intervalul t, pt = 1-qt
- St, proporția care supraviețuiește (sau rămâne fără evenimente) după intervalul t; aceasta se numește uneori probabilitatea cumulativă de supraviețuire și se calculează după cum urmează: În primul rând, proporția de participanți care supraviețuiesc după momentul 0 (momentul de început) este definită ca S0 = 1 (toți participanții în viață sau fără evenimente la momentul zero sau la începutul studiului). Proporția de supraviețuire după fiecare interval ulterior este calculată utilizând principiile probabilității condiționate introduse în modulul privind probabilitatea. Mai exact, probabilitatea ca un participant să supraviețuiască după intervalul 1 este S1 = p1. Probabilitatea ca un participant să supraviețuiască după intervalul 2 înseamnă că acesta a trebuit să supraviețuiască după intervalul 1 și prin intervalul 2: S2 = P(supraviețuire după intervalul 2) = P(supraviețuire prin intervalul 2)*P(supraviețuire după intervalul 1), sau S2 = p2*S1. În general, St+1 = pt+1*St.
Formatul tabelului de urmărire a vieții este prezentat mai jos.
Pentru primul interval, 0-4 ani: La momentul 0, începutul primului interval (0-4 ani), există 20 de participanți în viață sau la risc. Doi participanți mor în timpul intervalului și 1 este cenzurat. Aplicăm corecția pentru numărul de participanți cenzurați în timpul acelui interval pentru a obține Nt* =Nt-Ct/2 = 20-(1/2) = 19,5. Calculele pentru celelalte coloane sunt prezentate în tabel. Probabilitatea ca un participant să supraviețuiască după 4 ani, sau după primul interval (folosind limita superioară a intervalului pentru a defini timpul) este S4 = p4 = 0,897.
Pentru cel de-al doilea interval, 5-9 ani: Numărul la risc este numărul la risc din intervalul anterior (0-4 ani) minus cei care mor și sunt cenzurați (adică, Nt = Nt-1-Dt-1-Ct-1 = 20-2-1 = 17). Probabilitatea ca un participant să supraviețuiască după 9 ani este S9 = p9*S4 = 0,937*0,897 = 0,840.
Intervalul în ani |
Numărul la risc în timpul intervalului, Nt |
Numărul mediu la risc în timpul intervalului, Nt* |
Numărul de decese în timpul intervalului, Dt |
Pierdut la urmărire, Ct |
Proporția celor care mor În timpul intervalului, qt |
Printre cei cu risc, proporția celor care supraviețuiesc Interval, pt |
Probabilitatea de supraviețuire St |
---|---|---|---|---|---|---|---|
0-4 |
20 |
20-(1/2) = 19.5 |
2 |
1 |
2/19.5 = 0.103 |
1-0.103 = 0.897 |
1(0.897) = 0.897 |
5-9 |
17 |
17-(2/2) = 16.0 |
1 |
2 |
1/16 = 0.063 |
1-0.063 = 0.937 |
(0,897)(0,937)=0,840 |
Tabelul complet de urmărire a vieții este prezentat mai jos.
Intervalul în ani |
Numărul la risc în timpul intervalului, Nt |
Numărul mediu la risc în timpul intervalului, Nt* |
Numărul de decese în timpul intervalului, Dt |
Pierdut la urmărire, Ct |
Proporția celor care mor În timpul intervalului, qt |
Dintre cei cu risc, Proporția celor care supraviețuiesc În interval, pt |
Probabilitatea de supraviețuire St |
---|---|---|---|---|---|---|---|
0-4 |
20 |
19.5 |
2 |
1 |
0.103 |
0.897 |
0.897 |
5-9 |
17 |
16.0 |
1 |
2 |
0.063 |
0.937 |
0.840 |
10-14 |
14 |
12.0 |
1 |
4 |
0.083 |
0.917 |
0.770 |
15-19 |
9 |
7.5 |
1 |
3 |
0.133 |
0.867 |
0.668 |
20-24 |
5 |
3.0 |
1 |
4 |
0.333 |
0,667 |
0,446 |
Acest tabel utilizează metoda actuarială pentru a construi tabelul de urmărire a vieții, în care timpul este împărțit în intervale de timp egal distanțate.
Abordarea Kaplan-Meier (produs-limită)
O problemă cu abordarea tabelului de viață prezentată mai sus este că probabilitățile de supraviețuire se pot schimba în funcție de modul în care sunt organizate intervalele, în special în cazul eșantioanelor mici. Abordarea Kaplan-Meier, denumită și abordarea produs-limită, este o abordare populară care abordează această problemă prin reestimarea probabilității de supraviețuire de fiecare dată când are loc un eveniment.
Utilizarea adecvată a abordării Kaplan-Meier se bazează pe ipoteza că cenzura este independentă de probabilitatea de a dezvolta evenimentul de interes și că probabilitățile de supraviețuire sunt comparabile la participanții care sunt recrutați devreme și mai târziu în studiu. Atunci când se compară mai multe grupuri, este, de asemenea, important ca aceste ipoteze să fie îndeplinite în fiecare grup de comparație și ca, de exemplu, cenzura să nu fie mai probabilă într-un grup decât în altul.
Tabelul de mai jos utilizează abordarea Kaplan-Meier pentru a prezenta aceleași date care au fost prezentate mai sus folosind abordarea tabelului de viață. Rețineți că începem tabelul cu Timpul=0 și Probabilitatea de supraviețuire = 1. La Timpul=0 (linia de bază sau începutul studiului), toți participanții sunt expuși riscului, iar probabilitatea de supraviețuire este 1 (sau 100%). Cu abordarea Kaplan-Meier, probabilitatea de supraviețuire este calculată folosind St+1 = St*((Nt+1-Dt+1)/Nt+1). Rețineți că calculele care utilizează abordarea Kaplan-Meier sunt similare cu cele care utilizează abordarea tabelului de viață actuarial. Principala diferență este reprezentată de intervalele de timp, și anume, în cazul abordării tabelului de viață actuarial, luăm în considerare intervale de timp la intervale egale, în timp ce în cazul abordării Kaplan-Meier, utilizăm timpii evenimentelor observate și timpii de cenzură. Calculele probabilităților de supraviețuire sunt detaliate în primele câteva rânduri ale tabelului.
Tablă de viață utilizând abordarea Kaplan-Meier
Timp, Ani |
Numărul la risc Nt |
Numărul de decese Dt . |
Numărul cenzurat Ct |
Probabilitatea de supraviețuire St+1 = St*((Nt+1-Dt+1)/Nt+1) |
|||
---|---|---|---|---|---|---|---|
0 |
20 |
|
|
|
|
|
1 |
1 |
20 |
1 |
|
1*((20-1)/20) = 0.950 |
|||
2 |
19 |
|
1 |
0.950*((19-0)/19)=0.950 |
|||
3 |
18 |
1 |
|
0.950*((18-1)/18) = 0.897 |
|||
5 |
17 |
1 |
|
0.897*((17-1)/17) = 0.844 |
|||
6 |
16 |
|
1 |
0.844 |
|||
9 |
15 |
|
1 |
0.844 |
|||
10 |
14 |
|
1 |
0.844 |
|||
11 |
13 |
|
1 |
0.844 |
|||
12 |
12 |
|
1 |
0.844 |
|||
13 |
11 |
|
1 |
0.844 |
|||
14 |
10 |
1 |
|
0.760 |
|||
17 |
9 |
1 |
1 |
0.676 |
|||
18 |
7 |
|
1 |
0.676 |
|||
19 |
6 |
|
1 |
0.676 |
|||
21 |
5 |
|
1 |
0.676 |
|||
23 |
4 |
1 |
|
0.507 |
|||
24 |
3 |
|
|
3 |
3 |
0,507 |
Cu seturi mari de date, aceste calcule sunt anevoioase. Cu toate acestea, aceste analize pot fi generate de programe de calcul statistic precum SAS. Excel poate fi, de asemenea, utilizat pentru a calcula probabilitățile de supraviețuire odată ce datele sunt organizate pe momente și se rezumă numărul de evenimente și momentele cenzurate.
Din tabelul de viață putem produce o curbă de supraviețuire Kaplan-Meier.
Curba de supraviețuire Kaplan-Meier pentru datele de mai sus
În curba de supraviețuire prezentată mai sus, simbolurile reprezintă fiecare timp de eveniment, fie un deces, fie un timp cenzurat. Pornind de la curba de supraviețuire, putem estima, de asemenea, probabilitatea ca un participant să supraviețuiască după 10 ani, localizând 10 ani pe axa X și citind în sus și peste pe axa Y. Proporția de participanți care supraviețuiesc după 10 ani este de 84%, iar proporția de participanți care supraviețuiesc după 20 de ani este de 68%. Supraviețuirea mediană este estimată prin localizarea valorii 0,5 pe axa Y și citirea în sus și în jos până la axa X. Supraviețuirea mediană este de aproximativ 23 de ani.
Erorile standard și estimările intervalului de încredere ale probabilităților de supraviețuire
Aceste estimări ale probabilităților de supraviețuire la momente specifice și durata mediană de supraviețuire sunt estimări punctuale și trebuie interpretate ca atare. Există formule pentru a produce erori standard și estimări ale intervalelor de încredere ale probabilităților de supraviețuire care pot fi generate cu multe pachete de calcul statistic. O formulă populară pentru a estima eroarea standard a estimărilor de supraviețuire se numește formula Greenwoods5 și este următoarea:
Cantitatea se însumează pentru numerele la risc (Nt) și numerele de decese (Dt) care au avut loc până la momentul de interes (adică, cumulativ, în toate momentele anterioare momentului de interes, a se vedea exemplul din tabelul de mai jos). Se calculează erorile standard pentru estimările de supraviețuire pentru datele din tabelul de mai jos. Rețineți că ultima coloană arată cantitatea 1,96*SE(St), care reprezintă marja de eroare și este utilizată pentru calcularea estimărilor intervalului de încredere de 95% (adică St ± 1,96 x SE(St)).
Erorile standard ale estimărilor de supraviețuire
Timp, Ani |
Numărul la risc Nt |
Numărul de decese Dt |
Supraviețuire Probabilitate St |
1.96*SE (St) |
||||||
---|---|---|---|---|---|---|---|---|---|---|
0 |
20 |
|
|
1 |
|
|
|
. |
|
|
1 |
20 |
1 |
0.950 |
0.003 |
0.003 |
0.049 |
0.096 |
|||
2 |
19 |
|
0.950 |
0.000 |
0.003 |
0.049 |
0.096 |
|||
3 |
18 |
1 |
0.897 |
0.003 |
0.006 |
0.069 |
0.135 |
|||
5 |
17 |
1 |
0.844 |
0.004 |
0.010 |
0.083 |
0.162 |
|||
6 |
16 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
9 |
15 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
10 |
14 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
11 |
13 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
12 |
12 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
13 |
11 |
|
0.844 |
0.000 |
0.010 |
0.083 |
0.162 |
|||
14 |
10 |
1 |
0.760 |
0.011 |
0.021 |
0.109 |
0.214 |
|||
17 |
9 |
1 |
0.676 |
0.014 |
0.035 |
0.126 |
0.246 |
|||
18 |
7 |
|
0.676 |
0.000 |
0.035 |
0.126 |
0.246 |
|||
19 |
6 |
|
0.676 |
0.000 |
0.035 |
0.126 |
0.246 |
|||
21 |
5 |
|
0.676 |
0.000 |
0.035 |
0.126 |
0.246 |
|||
23 |
4 |
1 |
0.507 |
0.083 |
0.118 |
0.174 |
0.341 |
|||
24 |
3 |
|
0.507 |
0,000 |
0,118 |
0,174 |
0,341 |
Figura de mai jos sintetizează estimările și intervalele de încredere din figura de mai jos. Curba de supraviețuire Kaplan-Meier este prezentată ca o linie solidă, iar limitele de încredere de 95% sunt prezentate ca linii punctate.
Curba de supraviețuire Kaplan-Meier cu intervale de încredere
Curbe de incidență cumulativă
Câțiva investigatori preferă să genereze curbe de incidență cumulativă, spre deosebire de curbele de supraviețuire care arată probabilitățile cumulative de a suferi evenimentul de interes. Incidența cumulativă, sau probabilitatea cumulativă de eșec, este calculată ca 1-St și poate fi calculată cu ușurință din tabelul de viață utilizând abordarea Kaplan-Meier. Probabilitățile cumulative de eșec pentru exemplul de mai sus sunt prezentate în tabelul de mai jos.
Tabel de viață cu probabilități cumulative de eșec
Timp, Ani |
Numărul la risc Nt |
Numărul de decese Dt |
Numărul Cenzurat Ct |
Probabilitatea de supraviețuire St |
Probabilitatea de eșec 1-St |
|
---|---|---|---|---|---|---|
0 |
20 |
|
|
1 |
0 |
|
1 |
20 |
1 |
|
0.950 |
0.050 |
|
2 |
19 |
|
1 |
0.950 |
0.050 |
|
3 |
18 |
1 |
|
0.897 |
0.103 |
|
5 |
17 |
1 |
|
0.844 |
0.156 |
|
6 |
16 |
|
1 |
0.844 |
0.156 |
|
9 |
15 |
|
1 |
0.844 |
0.156 |
|
10 |
14 |
|
1 |
0.844 |
0.156 |
|
11 |
13 |
|
1 |
0.844 |
0.156 |
|
12 |
12 |
|
1 |
0.844 |
0.156 |
|
13 |
11 |
|
1 |
0.844 |
0.156 |
|
14 |
10 |
1 |
|
0.760 |
0.240 |
|
17 |
9 |
1 |
1 |
0.676 |
0.324 |
|
18 |
7 |
|
1 |
0.676 |
0.324 |
|
19 |
6 |
|
1 |
0.676 |
0.324 |
|
21 |
5 |
|
1 |
0.676 |
0.324 |
|
23 |
4 |
1 |
|
0.507 |
0.493 |
|
24 |
3 |
|
3 |
0.507 |
0,493 |
Figura de mai jos prezintă incidența cumulativă a deceselor pentru participanții înrolați în studiul descris mai sus.
Curba incidenței cumulative
Din această figură putem estima probabilitatea ca un participant să moară până la un anumit moment. De exemplu, probabilitatea de deces este de aproximativ 33% la 15 ani (vezi liniile punctate).
întoarceți-vă sus | pagina anterioară | pagina următoare
.