Eloonjäämisfunktion | Maternidad y todo

Eloonjäämisfunktion tai eloonjäämiskäyrän estimoinnissa on useita eri tapoja. On olemassa useita suosittuja parametrisia menetelmiä, joita käytetään eloonjäämisdatan mallintamiseen, ja ne eroavat toisistaan sen suhteen, mitä oletuksia tehdään eloonjäämisaikojen jakaumasta populaatiossa. Joitakin suosittuja jakaumia ovat eksponentti-, Weibull-, Gompertz- ja log-normaalijakaumat.2 Kenties suosituin on eksponenttijakauma, jossa oletetaan, että osallistujan todennäköisyys sairastua kiinnostavaan tapahtumaan on riippumaton siitä, kuinka kauan hän on ollut tapahtumasta vapaa. Muissa jakaumissa tehdään erilaisia oletuksia yksilön todennäköisyydestä sairastua tapahtumaan (eli se voi kasvaa, pienentyä tai muuttua ajan myötä). Yksityiskohtaisempia tietoja eloonjäämisanalyysin parametrisista menetelmistä löytyy teoksista Hosmer ja Lemeshow sekä Lee ja Wang1,3.

Keskitymme tässä yhteydessä kahteen ei-parametriseen menetelmään, jotka eivät tee oletuksia siitä, miten todennäköisyys, että henkilö sairastuu tapahtumaan, muuttuu ajan kuluessa. Ei-parametristen menetelmien avulla estimoidaan ja piirretään eloonjäämisjakauma tai eloonjäämiskäyrä. Eloonjäämiskäyrät esitetään usein porrasfunktioina, kuten alla olevassa kuvassa on esitetty. Aika on esitetty X-akselilla ja eloonjääminen (riskiryhmään kuuluvien henkilöiden osuus) Y-akselilla. Huomaa, että eloonjääneiden prosenttiosuus ei aina vastaa elossa olevien prosenttiosuutta (jolloin oletetaan, että kiinnostava lopputulos on kuolema). “Selviytyminen” voi tarkoittaa myös osuutta, joka on vapaa jostakin muusta lopputulostapahtumasta (esim. prosenttiosuus, joka on vapaa sydäninfarktista tai sydän- ja verisuonitaudista), tai se voi edustaa myös prosenttiosuutta, joka ei koe tervettä lopputulosta (esim. syövän remissiota).

Eloonjäämisfunktio

Eloonjäämisprosenttiosuus (Y-akselilla) 10 vuoden havainnointijakson aikana. Selviytyminen vähenee vaiheittain

Huomaa, että selviytymistodennäköisyys on 100 % kahden vuoden ajan ja laskee sitten 90 %:iin. Eloonjäämisen mediaani on 9 vuotta (eli 50 % väestöstä selviytyy 9 vuotta; ks. katkoviivat).

Esimerkki:

Harkitaan pientä prospektiivista kohorttitutkimusta, jonka tarkoituksena on tutkia aikaa kuolemaan. Tutkimukseen osallistuu 20 osallistujaa, jotka ovat 65-vuotiaita tai vanhempia; heidät rekisteröidään viiden vuoden aikana ja heitä seurataan enintään 24 vuoden ajan, kunnes he kuolevat, tutkimus päättyy tai he keskeyttävät tutkimuksen (lost to follow-up). Tiedot esitetään jäljempänä. Tutkimuksessa on 6 kuolemantapausta ja 3 osallistujaa, joiden seuranta on päättynyt kokonaan (eli 24 vuotta). Lopuilla 11:llä on alle 24 vuoden seuranta-aika, mikä johtuu myöhäisestä ilmoittautumisesta tai seurantakadosta.

Osallistujan tunnistenumero	kuoleman vuosi	vuosi. Viimeinen yhteydenotto
1		24
2	3
3		11
4		19
5		24
6		13
7	14
8		2
9		18
10		17
11		24
12		21
13		12
14	1
15		10
16	23
17		6
18	5
19		9
20	17

elinaikataulu (aktuaarinen taulukko)
Kaplan-Meierin (Product Limit) lähestymistapa
Eloonjäämistodennäköisyyksien keskivirheet ja luottamusvälin arviot
Kumulatiiviset ilmaantuvuuskäyrät

elinaikataulu (aktuaarinen taulukko)

Eräs tapa tiivistää osallistujien kokemukset on elinaikataulu, tai vakuutusmatemaattisen taulukon avulla. Elinaikatauluja käytetään usein vakuutusalalla elinajanodotteen arvioimiseen ja vakuutusmaksujen määrittämiseen. Keskitymme tietyntyyppiseen elinaikatauluun, jota käytetään laajalti biostatistisissa analyyseissä ja jota kutsutaan kohortin elinaikatauluksi tai seurantaelinaikatauluksi. Seurantaelinaikataulussa esitetään yhteenveto osallistujien kokemuksista ennalta määritellyn seurantajakson aikana kohorttitutkimuksessa tai kliinisessä tutkimuksessa siihen asti, kun kiinnostava tapahtuma tapahtuu tai tutkimus päättyy, riippuen siitä, kumpi tapahtuu ensin.

Elinaikataulukon rakentamiseksi järjestetään ensin seuranta-ajat tasaisin väliajoin. Yllä olevassa taulukossa seuranta-aika on enintään 24 vuotta, ja tarkastelemme viiden vuoden aikavälejä (0-4, 5-9, 10-14, 15-19 ja 20-24 vuotta). Laskemme yhteen niiden osallistujien määrän, jotka ovat elossa kunkin jakson alussa, niiden määrän, jotka kuolevat, ja niiden määrän, jotka sensuroidaan kullakin jaksolla.

Intervalli vuosina	Välin alussa elossa olevien määrä	Kuolleiden määrä välin aikana	Sensuroitujen määrä
0-4	20	2	1
5-9	17	1	2
10-14	14	1	4
15-19	9	1	3
20-24	5	1	4

Käytämme elintapa-analyysissämme seuraavaa notaatiota. Määrittelemme ensin notaation ja käytämme sitä sitten elinaikataulukon rakentamiseen.

Nt = niiden osallistujien lukumäärä, jotka ovat tapahtumavapaita ja joita pidetään riskiryhmään kuuluvina aikavälillä t (esim, tässä esimerkissä elossa olevien määrä, koska kiinnostava lopputulos on kuolema)
Dt = niiden osallistujien määrä, jotka kuolevat (tai kärsivät kiinnostavasta tapahtumasta) ajanjakson t aikana
Ct = niiden osallistujien määrä, jotka sensuroidaan ajanjakson t aikana Nt* = riskiryhmään kuuluvien osallistujien keskimääräinen määrä ajanjakson t aikana
Nt* = riskiryhmään kuuluvien osallistujien keskimääräinen määrä ajanjakson t aikana [Vakuutusmatemaattisia elinaikataulukoita konstruoitaessa käytetään usein seuraavia oletuksia: Ensinnäkin oletetaan, että kiinnostavat tapahtumat (esim. kuolemantapaukset) tapahtuvat ajanjakson lopussa ja että sensuroidut tapahtumat tapahtuvat tasaisesti (tai tasaisesti) koko ajanjakson aikana. Tämän vuoksi Nt:hen tehdään usein mukautus, joka kuvastaa riskissä olevien osallistujien keskimääräistä lukumäärää jakson aikana, Nt*, joka lasketaan seuraavasti: Nt* =Nt-Ct/2 (ts., vähennetään puolet sensuroiduista tapahtumista).
qt = kuolevien (tai tapahtumasta kärsivien) osuus ajanjakson t aikana, qt = Dt/Nt*
pt = eloonjääneiden (tapahtumasta vapaana pysyvien) osuus ajanjakson t aikana, pt = 1-qt
St, eloonjääneiden (tai tapahtumasta vapaana pysyvien) osuus ajanjakson t jälkeen; tätä kutsutaan toisinaan nimellä kumulatiivinen eloonjäämistodennäköisyys, ja se lasketaan seuraavasti: Ensin määritellään niiden osallistujien osuus, jotka selviytyvät ajankohdan 0 (aloitusajankohta) jälkeen, seuraavasti: S0 = 1 (kaikki osallistujat elossa tai tapahtumasta vapaita ajankohtana nolla eli tutkimuksen aloitusajankohtana). Kunkin myöhemmän ajanjakson jälkeen eloonjääneiden osuus lasketaan käyttäen ehdollisen todennäköisyyden periaatteita, jotka esiteltiin moduulissa Todennäköisyys. Tarkemmin sanottuna todennäköisyys sille, että osallistuja jää eloon ajanjakson 1 jälkeen, on S1 = p1. Todennäköisyys, että osallistuja selviytyy ajanjakson 2 jälkeen, tarkoittaa, että hänen oli selviydyttävä ajanjakson 1 jälkeen ja ajanjakson 2 läpi: S2 = P(selviytyminen ajanjakson 2 jälkeen) = P(selviytyminen ajanjakson 2 läpi)*P(selviytyminen ajanjakson 1 jälkeen), tai S2 = p2*S1. Yleisesti ottaen St+1 = pt+1*St.

Seurantaelinaikataulukon muoto on esitetty alla.

Ensimmäiselle aikavälille, 0-4 vuotta: Ajankohtana 0, ensimmäisen intervallin (0-4 vuotta) alussa, on 20 osallistujaa elossa tai riskiryhmässä. Kaksi osallistujaa kuolee intervallin aikana ja yksi sensuroidaan. Sovelletaan korjausta kyseisen ajanjakson aikana sensuroitujen osallistujien lukumäärää varten, jolloin saadaan Nt* =Nt-Ct/2 = 20-(1/2) = 19,5. Muiden sarakkeiden laskelmat esitetään taulukossa. Todennäköisyys sille, että osallistuja jää eloon yli 4 vuoden eli ensimmäisen intervallin jälkeen (kun käytetään intervallin ylärajaa ajan määrittelyyn) on S4 = p4 = 0,897.

Toisen intervallin, 5-9 vuoden, osalta: Riskiluku on edellisen aikavälin (0-4 vuotta) riskiluku, josta on vähennetty ne, jotka kuolevat ja jotka on sensuroitu (eli Nt = Nt-1-Dt-1-Dt-1-Ct-1 = 20-2-1 = 17). Todennäköisyys sille, että osallistuja selviytyy yli 9 vuotta on S9 = p9*S4 = 0,937*0,897 = 0,840.

Intervalli vuosina	Riskissä olevien lukumäärä väliajalla, Nt	Keskimääräinen riskissä olevien lukumäärä väliajalla, Nt*	Kuolleiden määrä väliajalla, Dt	Seurantaan kadonneet, Ct	Kuolemien osuus Välin aikana, qt	Riskiryhmään kuuluvien osuus elossa Interval, pt	Survival Probability St
0-4	20	20-(1/2) = 19.5	2	1	2/19.5 = 0.103	1-0.103 = 0.897	1(0.897) = 0.897
5-9	17	17-(2/2) = 16.0	1	2	1/16 = 0.063	1-0.063 = 0.937	(0.897)(0.937)=0.840

Intervalli vuosina

Riskissä olevien lukumäärä väliajalla,

Keskimääräinen riskissä olevien lukumäärä väliajalla, Nt*

Kuolleiden määrä väliajalla, Dt

Seurantaan kadonneet,

Kuolemien osuus

Välin aikana,

Riskiryhmään kuuluvien osuus elossa

Interval, pt

Survival Probability St

0-4

20-(1/2) = 19.5

2/19.5 = 0.103

1-0.103 = 0.897

1(0.897) = 0.897

5-9

17-(2/2) = 16.0

1/16 = 0.063

1-0.063 = 0.937

(0.897)(0.937)=0.840

Täydellinen seurantaelämän taulukko on esitetty alla.

Intervalli vuosina	Riskialttiiden määrä intervallin aikana, Nt	Keskimääräinen riskialttiiden määrä intervallin aikana, Nt*	Kuolleiden määrä väliajalla, Dt	Seurantaan kadonneet, Ct	Proportion Dying During Interval, qt	Among those at Risk, Proportion Surviving Interval,pt	Survival Probability St
0-4	20	19.5	2	1	0.103	0.897	0.897
5-9	17	16.0	1	2	0.063	0.937	0.840
10-14	14	12.0	1	4	0.083	0.917	0.770
15-19	9	7.5	1	3	0.133	0.867	0.668
20-24	5	3.0	1	4	0.333	0.667	0.446

Tässä taulukossa käytetään vakuutusmatemaattista menetelmää seurantakäyntiaikataulukon muodostamiseen, jossa aika on jaettu tasaisin väliajoin.

Kaplan-Meierin (Product Limit) lähestymistapa

Yllä esitetyn elinaikataulukon lähestymistavan ongelmana on se, että eloonjäämistodennäköisyydet voivat muuttua sen mukaan, miten aikavälit on järjestetty, erityisesti pienillä otoksilla. Kaplan-Meier-lähestymistapa, jota kutsutaan myös nimellä product limit -lähestymistapa, on suosittu lähestymistapa, joka ratkaisee tämän ongelman arvioimalla eloonjäämistodennäköisyyden uudelleen aina, kun tapahtuma sattuu.

Kaplan-Meier-lähestymistavan tarkoituksenmukainen käyttö perustuu olettamukseen, että sensurointi on riippumaton kiinnostavan tapahtuman todennäköisyydestä ja että eloonjäämistodennäköisyyksien todennäköisyydet ovat vertailukelpoisia osanottajilla, jotka rekrytoitiin varhaisessa vaiheessa ja myöhemmin tutkimukseen. Kun verrataan useita ryhmiä, on myös tärkeää, että nämä oletukset täyttyvät kussakin vertailuryhmässä ja että esimerkiksi sensurointi ei ole todennäköisempää yhdessä ryhmässä kuin toisessa.

Alla olevassa taulukossa käytetään Kaplan-Meier-menetelmää samojen tietojen esittämiseen, jotka esitettiin edellä elinaikataulukkomenetelmää käyttäen. Huomaa, että aloitamme taulukon ajalla Time=0 ja Survival Probability = 1. Ajankohtana = 0 (lähtötilanne tai tutkimuksen alku) kaikki osallistujat ovat vaarassa ja eloonjäämistodennäköisyys on 1 (tai 100 %). Kaplan-Meierin lähestymistavassa eloonjäämistodennäköisyys lasketaan käyttämällä St+1 = St*((Nt+1-Dt+1)/Nt+1). Huomattakoon, että Kaplan-Meier-menetelmää käyttävät laskelmat ovat samanlaisia kuin vakuutusmatemaattista elinaikataulua käyttävät laskelmat. Suurin ero on aikaväleissä, eli vakuutusmatemaattisen elinaikataulukon lähestymistavassa tarkastellaan tasaisin väliajoin annettuja aikavälejä, kun taas Kaplan-Meierin lähestymistavassa käytetään havaittuja tapahtuma-aikoja ja sensurointiaikoja. Eloonjäämistodennäköisyyksien laskelmat on esitetty yksityiskohtaisesti taulukon ensimmäisillä riveillä.

Kaplan-Meierin lähestymistapaa käyttävä elinaikataulukko

Aika, Years	Number at Risk Nt	Number of Deaths Dt	Sensuroitujen määrä Ct	Selviytymistodennäköisyys St+1 = St*((Nt+1-Dt+1)/Nt+1)
0	20				1
1	20	1		1*((20-1)/20) = 0.950
2	19		1	0.950*((19-0)/19)=0.950
3	18	1		0.950*((18-1)/18) = 0.897
5	17	1		0.897*((17-1)/17) = 0.844
6	16		1	0.844
9	15		1	0.844
10	14		1	0.844
11	13		1	0.844
12	12		1	0.844
13	11		1	0.844
14	10	1		0.760
17	9	1	1	0.676
18	7		1	0.676
19	6		1	0.676
21	5		1	0.676
23	4	1		0.507
24	3			3	0.507

Suurilla aineistojoukoilla nämä laskutoimitukset ovat työläitä. Nämä analyysit voidaan kuitenkin tuottaa SAS:n kaltaisilla tilastollisilla laskentaohjelmilla. Excel-ohjelmaa voidaan käyttää myös eloonjäämistodennäköisyyksien laskemiseen, kun aineisto on järjestetty ajankohtien mukaan ja tapahtumien lukumäärät ja sensuroidut ajankohdat on koottu yhteen.

Elinaikataulusta voidaan tuottaa Kaplan-Meierin eloonjäämiskäyrä.

Kaplan-Meierin eloonjäämiskäyrä yllä oleville tiedoille

Eloonjäämiskäyrä alkaa arvosta 1,0 ja laskee asteittain 50 %:n eloonjäämiskäyriin 25 vuoden ikäisenä. Kymmenen vuoden kohdalla eloonjääminen näyttää olevan noin 84 %..

Yllä esitetyssä eloonjäämiskäyrässä symbolit edustavat kutakin tapahtuma-aikaa, joko kuolemaa tai sensuroitua aikaa. Eloonjäämiskäyrästä voidaan myös arvioida todennäköisyys sille, että osallistuja selviytyy 10 vuoden jälkeen, sijoittamalla 10 vuotta X-akselille ja lukemalla Y-akselille ylös ja yli. Niiden osallistujien osuus, jotka selviytyvät 10 vuoden jälkeen, on 84 %, ja niiden osallistujien osuus, jotka selviytyvät 20 vuoden jälkeen, on 68 %. Eloonjäämisen mediaani arvioidaan sijoittamalla 0,5 Y-akselille ja lukemalla X-akselin yli ja alas. Eloonjäämisajan mediaani on noin 23 vuotta.

Eloonjäämistodennäköisyyksien keskivirheet ja luottamusvälin arviot

Nämä arviot eloonjäämistodennäköisyyksistä tiettyinä ajankohtina ja eloonjäämisajan mediaanista ovat piste-estimaatteja, ja niitä on tulkittava sellaisina. Eloonjäämistodennäköisyyksien keskivirheiden ja luottamusvälin estimaattien tuottamiseksi on olemassa kaavoja, jotka voidaan tuottaa monilla tilastollisilla laskentapaketeilla. Suosittu kaava eloonjäämisestimaattien keskivirheen arvioimiseksi on nimeltään Greenwoodin5 kaava, ja se on seuraava:

Suuruus summataan riskissä olevien lukumäärille (Nt) ja kuolemantapausten lukumäärille (Dt), jotka tapahtuvat kiinnostavana ajankohtana (eli kumulatiivisesti, kaikkien ajankohtien yli ennen kiinnostavaa ajankohtaa, ks. esimerkki alla olevassa taulukossa). Jäljempänä olevassa taulukossa esitettyjen tietojen eloonjäämisestimaateille on laskettu keskivirheet. Huomaa, että viimeisessä sarakkeessa on luku 1,96*SE(St), joka on virhemarginaali ja jota käytetään 95 prosentin luottamusvälin estimaattien laskemiseen (eli St ± 1,96 x SE(St)).

Eloonjäämisarvioiden keskivirheet

Aika, Years	Number at Risk Nt	Number of Deaths Dt	Survival Todennäköisyys St				1.96*SE (St)
0	20		1		1
1	20	1	0.950	0.003	0.003	0.049	0.096
2	19		0.950	0.000	0.003	0.049	0.096
3	18	1	0.897	0.003	0.006	0.069	0.135
5	17	1	0.844	0.004	0.010	0.083	0.162
6	16		0.844	0.000	0.010	0.083	0.162
9	15		0.844	0.000	0.010	0.083	0.162
10	14		0.844	0.000	0.010	0.083	0.162
11	13		0.844	0.000	0.010	0.083	0.162
12	12		0.844	0.000	0.010	0.083	0.162
13	11		0.844	0.000	0.010	0.083	0.162
14	10	1	0.760	0.011	0.021	0.109	0.214
17	9	1	0.676	0.014	0.035	0.126	0.246
18	7		0.676	0.000	0.035	0.126	0.246
19	6		0.676	0.000	0.676	0.000	0.035	0.126	0.246
23	4	1	0.507	0.083	0.118	0.174	0.341
24	3		0.507	0.000	0.118		0.174	0.341

Alhaalla olevassa kuviossa on esitetty yhteenvetona alla olevassa kuviossa esitettyjä estimaatteja ja niiden luotettavuusalueita. Kaplan-Meierin eloonjäämiskäyrä on esitetty yhtenäisenä viivana, ja 95 prosentin luottamusrajat on esitetty katkoviivoina.

Kaplan-Meierin eloonjäämiskäyrä luottamusväleineen

Edellinen Kaplan-Meirer-käyrä, jonka mukaan eloonjäämisaste laskee 100 prosentista 50 prosenttiin 10 vuoden aikana, on esitetty, ja sen ylä- ja alapuolella on viivat, jotka ilmaisevat eloonjäämiskestävyysestimaattien 95 prosentin luottamusrajat.

Kumulatiiviset ilmaantuvuuskäyrät

Jotkut tutkijat haluavat luoda kumulatiivisia ilmaantuvuuskäyriä, toisin kuin eloonjäämiskäyriä, jotka osoittavat kumulatiiviset todennäköisyydet kokea kiinnostava tapahtuma. Kumulatiivinen ilmaantuvuus eli kumulatiivinen epäonnistumistodennäköisyys lasketaan muodossa 1-St, ja se voidaan helposti laskea elinaikataulusta Kaplan-Meierin lähestymistapaa käyttäen. Edellä esitetyn esimerkin kumulatiiviset vikaantumistodennäköisyydet on esitetty alla olevassa taulukossa.

Life Table with Cumulative Failure Probabilities

Aika, Years	Number at Risk Nt	Number of Deaths Dt	Number Censored Ct	Survival Probability St	Failure Probability 1-St
0	20					1	0
1	20	1		0.950	0.050
2	19		1	0.950	0.050
3	18	1		0.897	0.103
5	17	1		0.844	0.156
6	16		1	0.844	0.156
9	15		1	0.844	0.156
10	14		1	0.844	0.156
11	13		1	0.844	0.156
12	12		1	0.844	0.156
13	11		1	0.844	0.156
14	10	1		0.760	0.240
17	9	1	1	0.676	0.324
18	7		1	0.676	0.324
19	6		1	0.676	0.324
21	5		1	0.676	0.324
23	4	1		0.507	0.493
24	3		3	0.507	0.493

Alla olevassa kuvassa on esitetty edellä kuvattuun tutkimukseen osallistuneiden osallistujien kumulatiivinen kuoleman esiintyvyys.

Kumulatiivinen ilmaantuvuuskäyrä

Y-akseli on kuoleman kumulatiivinen ilmaantuvuus 0-0,6. X-akseli on aika 25 vuoden aikana. Kuoleman todennäköisyys kasvaa s asteittain, kunnes 25 vuoden kuluttua todennäköisyys on 0,5.

Tästä kuviosta voidaan arvioida todennäköisyys, että osallistuja kuolee tiettyyn ajankohtaan mennessä. Esimerkiksi kuoleman todennäköisyys on noin 33 % 15 vuoden iässä (ks. katkoviivat).

palaa alkuun | edellinen sivu | seuraava sivu

Osallistujan tunnistenumero	kuoleman vuosi	vuosi. Viimeinen yhteydenotto
1		24
2	3
3		11
4		19
5		24
6		13
7	14
8		2
9		18
10		17
11		24
12		21
13		12
14	1
15		10
16	23
17		6
18	5
19		9
20	17

Osallistujan tunnistenumero	kuoleman vuosi	vuosi. Viimeinen yhteydenotto
1		24
2	3
3		11
4		19
5		24
6		13
7	14
8		2
9		18
10		17
11		24
12		21
13		12
14	1
15		10
16	23
17		6
18	5
19		9
20	17

elinaikataulu (aktuaarinen taulukko)

Kaplan-Meierin (Product Limit) lähestymistapa

Eloonjäämistodennäköisyyksien keskivirheet ja luottamusvälin arviot

Kumulatiiviset ilmaantuvuuskäyrät

Vastaa Peruuta vastaus

Osallistujan tunnistenumero	kuoleman vuosi	vuosi. Viimeinen yhteydenotto
1		24
2	3
3		11
4		19
5		24
6		13
7	14
8		2
9		18
10		17
11		24
12		21
13		12
14	1
15		10
16	23
17		6
18	5
19		9
20	17