Estimando a Função de Sobrevivência

Existem várias formas diferentes de estimar uma função de sobrevivência ou uma curva de sobrevivência. Existem vários métodos paramétricos populares que são usados para modelar dados de sobrevivência, e diferem em termos das suposições que são feitas sobre a distribuição dos tempos de sobrevivência na população. Algumas distribuições populares incluem as distribuições exponencial, Weibull, Gompertz e log-normal.2 Talvez a mais popular seja a distribuição exponencial, que assume que a probabilidade de um participante sofrer o evento de interesse é independente de há quanto tempo essa pessoa está livre de eventos. Outras distribuições fazem suposições diferentes sobre a probabilidade de um indivíduo desenvolver um evento (ou seja, pode aumentar, diminuir ou mudar com o tempo). Mais detalhes sobre métodos paramétricos para análise de sobrevivência podem ser encontrados em Hosmer e Lemeshow e Lee e Wang1,3.

Focamos aqui em dois métodos não paramétricos, que não fazem suposições sobre como a probabilidade de uma pessoa desenvolver o evento muda ao longo do tempo. Usando métodos não paramétricos, nós estimamos e plotamos a distribuição de sobrevivência ou a curva de sobrevivência. As curvas de sobrevivência são frequentemente traçadas como funções de passo, como mostrado na figura abaixo. O tempo é mostrado no eixo X e a sobrevivência (proporção de pessoas em risco) é mostrada no eixo Y. Note que a porcentagem de participantes sobreviventes nem sempre representa a porcentagem que está viva (o que pressupõe que o resultado de interesse é a morte). “Sobrevivência” também pode se referir à proporção que está livre de outro evento de resultado (por exemplo, porcentagem livre de IM ou doença cardiovascular), ou também pode representar a porcentagem que não experimenta um resultado saudável (por exemplo, remissão de câncer).

Função de Sobrevivência

Sobrevivência percentual (eixo Y) ao longo de 10 anos de observação. Há uma diminuição gradual na sobrevivência

Nota que a probabilidade de sobrevivência é de 100% durante 2 anos e depois cai para 90%. A mediana de sobrevivência é de 9 anos (ou seja, 50% da população sobrevive 9 anos; ver linhas tracejadas).

Exemplo:

Considerar um pequeno estudo de coorte prospectivo projetado para estudar o tempo até a morte. O estudo envolve 20 participantes com 65 anos de idade ou mais; eles estão matriculados por um período de 5 anos e são acompanhados por até 24 anos até a morte, o estudo termina, ou eles desistem do estudo (perdidos para acompanhamento). Os dados são mostrados abaixo. No estudo, há 6 mortes e 3 participantes com acompanhamento completo (ou seja, 24 anos). Os 11 restantes têm menos de 24 anos de acompanhamento devido à inscrição tardia ou à perda de acompanhamento.

Número de Identificação do Participante

Ano da Morte

Ano do Último Contacto

>1

>

>

24

2

3

3

11

4

19

5

24

6

13

7

14

8

2

9

18

10

17

11

24

12

21

13

12

14

1

15

10

16

23

17

6

18

5

19

>9

>20

>

17

>

Tabela de Vida (Tabela Actuarial)

Uma forma de resumir as experiências dos participantes é com uma tábua de vida, ou uma tábua atuarial. As tábuas de vida são frequentemente usadas no setor de seguros para estimar a expectativa de vida e para definir os prêmios. Nós nos concentramos em um tipo particular de tábua de vida usada amplamente na análise bioestatística chamada tábua de vida de coorte ou uma tábua de vida de acompanhamento. A tábua de vida de acompanhamento resume as experiências dos participantes durante um período de acompanhamento predefinido em um estudo de coorte ou em um ensaio clínico até o momento do evento de interesse ou o final do estudo, o que ocorrer primeiro.

Para construir uma tábua de vida, primeiro organizamos os tempos de acompanhamento em intervalos igualmente espaçados. Na tabela acima temos um seguimento máximo de 24 anos, e consideramos intervalos de 5 anos (0-4, 5-9, 10-14, 15-19 e 20-24 anos). Somamos o número de participantes que estão vivos no início de cada intervalo, o número que morre e o número que é censurado em cada intervalo.

Intervalo em anos

Número Vivo no Início do Intervalo

Número de Mortes Durante o Intervalo

Número Censurado

0-4

20

2

1

5-9

17

1

2

10-14

14

1

4

15-19

9

1

3

20-24

>5

>1

4

Usamos a seguinte notação na nossa análise da tábua de mortalidade. Primeiro definimos a notação e depois a usamos para construir a tábua de mortalidade.

  • Nt = número de participantes que estão livres de eventos e considerados em risco durante o intervalo t (por exemplo, neste exemplo o número vivo como nosso resultado de interesse é a morte)
  • Dt = número de participantes que morrem (ou sofrem o evento de interesse) durante o intervalo t
  • Ct = número de participantes que são censurados durante o intervalo t Nt* = número médio de participantes em risco durante o intervalo t
  • Nt* = número médio de participantes em risco durante o intervalo t [Na construção das tábuas de vida actuariais, as seguintes suposições são frequentemente feitas: Primeiro, assume-se que os eventos de interesse (por exemplo, mortes) ocorrem no final do intervalo e assume-se que os eventos censurados ocorrem uniformemente (ou uniformemente) ao longo do intervalo. Portanto, muitas vezes é feito um ajuste para Nt para refletir o número médio de participantes em risco durante o intervalo, Nt*, que é calculado da seguinte forma: Nt* =Nt-Ct/2 (ou seja, Nt* =Nt-Ct/2), subtraímos metade dos eventos censurados).
  • qt = proporção de morte (ou evento de sofrimento) durante o intervalo t, qt = Dt/Nt*
  • pt = proporção de sobrevivência (evento remanescente livre) intervalo t, pt = 1-qt
  • St, a proporção de sobrevivência (ou evento remanescente livre) passado intervalo t; isto é às vezes chamado de probabilidade de sobrevivência cumulativa e é calculado da seguinte forma Primeiro, a proporção de participantes sobrevivendo no tempo passado 0 (hora de início) é definida como S0 = 1 (todos os participantes vivos ou livres de evento no tempo zero ou início do estudo). A proporção de sobrevivência após cada intervalo subseqüente é computada usando princípios de probabilidade condicional introduzidos no módulo sobre Probabilidade. Especificamente, a probabilidade de um participante sobreviver ao intervalo passado 1 é S1 = p1. A probabilidade de um participante sobreviver ao intervalo passado 2 significa que ele teve que sobreviver ao intervalo passado 1 e através do intervalo 2: S2 = P(sobreviver ao intervalo passado 2) = P(sobreviver ao intervalo 2)*P(sobreviver ao intervalo passado 1), ou S2 = p2*S1. Em geral, St+1 = pt+1*St.

O formato da tabela de vida útil seguinte é mostrado abaixo.

Para o primeiro intervalo, 0-4 anos: No tempo 0, no início do primeiro intervalo (0-4 anos), há 20 participantes vivos ou em risco. Dois participantes morrem no intervalo e 1 é censurado. Aplicamos a correção para o número de participantes censurados durante esse intervalo para produzir Nt* =Nt-Ct/2 = 20-(1/2) = 19,5. Os cálculos das restantes colunas são mostrados na tabela. A probabilidade de um participante sobreviver nos últimos 4 anos, ou passar o primeiro intervalo (usando o limite superior do intervalo para definir o tempo) é S4 = p4 = 0,897.

Para o segundo intervalo, 5-9 anos: O número em risco é o número em risco no intervalo anterior (0-4 anos) menos aqueles que morrem e são censurados (ou seja, Nt = Nt-1-Dt-1-Ct-1 = 20-2-1 = 17). A probabilidade de um participante sobreviver nos últimos 9 anos é S9 = p9*S4 = 0,937*0,897 = 0,840.

Intervalo em anos

Número em risco durante o intervalo,

Nt

Número médio em risco durante o intervalo, Nt*

Número de mortes durante o intervalo, Dt

Perdidos para acompanhamento,

Ct

Morte por Proporção

Intervalo de Duração,

qt

Entre os Em Risco, Sobrevivendo Proporção

Intervalo, pt

Probabilidade de sobrevivência St

0-4

20

20-(1/2) = 19.5

2

1

2/19.5 = 0.103

1-0.103 = 0.897

1(0.897) = 0.897

5-9

17

17-(2/2) = 16.0

1

2

1/16 = 0.063

1-0.063 = 0.937

(0,897)(0,937)=0,840

A tabela de vida de seguimento completa é mostrada abaixo.

Intervalo em anos

Número em risco durante o intervalo,

Nt

Número médio em risco durante o intervalo, Nt*

Número de mortes durante o intervalo, Dt

Perdidos para acompanhamento,

Ct

Morte por Proporção

Intervalo de Duração,

qt

Entre aqueles em Risco, Proporção de Sobrevivência

Interval, pt

Probabilidade de Sobrevivência St

0-4

20

>19.5

2

1

0.103

0.897

0.897

5-9

17

16.0

1

2

0.063

0.937

0.840

10-14

14

12.0

1

4

0.083

0.917

0.770

15-19

9

7.5

1

3

0.133

0.867

0.668

20-24

5

3.0

1

4

0.333

0,667

0,446

Esta tabela utiliza o método actuarial para construir a tábua de vida de seguimento onde o tempo é dividido em intervalos igualmente espaçados.

Kaplan-Meier (Limite do Produto) Abordagem

Uma questão com a abordagem da tábua de vida mostrada acima é que as probabilidades de sobrevivência podem mudar dependendo de como os intervalos são organizados, particularmente com amostras pequenas. A abordagem de Kaplan-Meier, também chamada de abordagem limite de produto, é uma abordagem popular que aborda esta questão ao reestimar a probabilidade de sobrevivência cada vez que um evento ocorre.

O uso apropriado da abordagem Kaplan-Meier repousa na suposição de que a censura é independente da probabilidade de desenvolver o evento de interesse e que as probabilidades de sobrevivência são comparáveis em participantes que são recrutados cedo e mais tarde para o estudo. Ao comparar vários grupos, também é importante que estas suposições sejam satisfeitas em cada grupo de comparação e que, por exemplo, a censura não é mais provável em um grupo do que em outro.

A tabela abaixo usa a abordagem Kaplan-Meier para apresentar os mesmos dados que foram apresentados acima usando a abordagem da tábua de vida. Note que iniciamos a tabela com Time=0 e Survival Probability = 1. No Tempo=0 (linha de base, ou o início do estudo), todos os participantes estão em risco e a probabilidade de sobrevivência é 1 (ou 100%). Com a abordagem de Kaplan-Meier, a probabilidade de sobrevivência é calculada usando St+1 = St*((Nt+1-Dt+1)/Nt+1). Note que os cálculos usando a abordagem de Kaplan-Meier são similares àqueles usando a abordagem da tábua de vida atuarial. A principal diferença são os intervalos de tempo, ou seja, com a abordagem da tábua de vida atuarial consideramos intervalos igualmente espaçados, enquanto que com a abordagem de Kaplan-Meier usamos tempos de eventos observados e tempos de censura. Os cálculos das probabilidades de sobrevivência estão detalhados nas primeiras linhas da tábua.

Tempo, Anos

Número em Risco

Nt

Número de Mortes

Dt

Número Censurado

Ct

Probabilidade de sobrevivência

St+1 = St*((Nt+1-Dt+1)/Nt+1)

>0

20

1

1

20

1

1*((20-1)/20) = 0.950

2

19

1

0.950*((19-0)/19)=0.950

3

18

1

0.950*((18-1)/18) = 0.897

5

17

1

0.897*((17-1)/17) = 0.844

6

16

1

0.844

9

15

1

0.844

10

14

1

0.844

11

13

1

0.844

12

12

1

0.844

13

11

1

0.844

14

10

1

0.760

17

9

1

1

0.676

18

7

1

0.676

19

6

1

0.676

21

5

1

0.676

23

4

1

0.507

>3

>

3

>0,507

Com grandes conjuntos de dados, estes cálculos são tediosos. Entretanto, estas análises podem ser geradas por programas de computação estatística como o SAS. O Excel também pode ser usado para calcular as probabilidades de sobrevivência, uma vez que os dados são organizados por tempos e os números de eventos e tempos censurados são resumidos.

Da tabela de vida podemos produzir uma curva de sobrevivência Kaplan-Meier.

Kaplan-Meier Survival Curve for the Data Above

A curva de sobrevivência começa em 1.0 e desce para uma sobrevivência de 50% aos 25 anos. Aos 10 anos a sobrevivência parece ser de cerca de 84%..

Na curva de sobrevivência mostrada acima, os símbolos representam cada tempo de evento, seja um tempo de morte ou um tempo censurado. A partir da curva de sobrevivência, podemos também estimar a probabilidade de um participante sobreviver aos 10 anos, localizando 10 anos no eixo X e lendo para cima e para cima do eixo Y. A proporção de participantes sobreviventes nos últimos 10 anos é de 84%, e a proporção de participantes sobreviventes nos últimos 20 anos é de 68%. A mediana de sobrevivência é estimada localizando 0,5 no eixo Y e lendo para cima e para baixo até o eixo X. A mediana de sobrevivência é de aproximadamente 23 anos.

Estimativas de Sobrevivência de Erros Padrão e Intervalo de Confiança

Estas estimativas de probabilidades de sobrevivência em momentos específicos e o tempo de sobrevivência mediano são estimativas pontuais e devem ser interpretadas como tal. Existem fórmulas para produzir erros padrão e estimativas de intervalos de confiança das probabilidades de sobrevivência que podem ser geradas com muitos pacotes de computação estatística. Uma fórmula popular para estimar o erro padrão das estimativas de sobrevivência é chamada fórmula Greenwoods5 e é a seguinte:

A quantidade é somada para números em risco (Nt) e números de mortes (Dt) que ocorrem ao longo do tempo de interesse (ou seja, cumulativo, em todos os momentos antes do tempo de interesse, ver exemplo na tabela abaixo). Os erros padrão são calculados para as estimativas de sobrevivência para os dados da tabela abaixo. Observe que a coluna final mostra a quantidade 1,96*SE(St) que é a margem de erro e usada para calcular as estimativas de intervalo de confiança de 95% (ou seja, St ± 1,96 x SE(St)).

Estimações de erro padrão de sobrevivência

Tempo, Anos

Número em risco

Nt

Número de mortes

Dt

Survival Probabilidade

St

KM2.png

>

KM3.png

KM4.png

1.96*SE (St)

0

>

20

>1

1

20

1

0.950

0.003

0.003

0.049

0.096

2

19

0.950

0.000

0.003

0.049

0.096

3

18

1

0.897

0.003

0.006

0.069

0.135

5

17

1

0.844

0.004

0.010

0.083

0.162

6

16

0.844

0.000

0.010

0.083

0.162

9

15

0.844

0.000

0.010

0.083

0.162

10

14

0.844

0.000

0.010

0.083

0.162

11

13

0.844

0.000

0.010

0.083

0.162

12

12

0.844

0.000

0.010

0.083

0.162

13

11

0.844

0.000

0.010

0.083

0.162

14

10

1

0.760

0.011

0.021

0.109

0.214

17

9

1

0.676

0.014

0.035

0.126

0.246

18

7

0.676

0.000

0.035

0.126

0.246

19

6

0.676

0.000

0.035

0.126

0.246

21

5

0.676

0.000

0.035

0.126

0.246

23

4

1

0.507

0.083

0.118

0.174

0.341

24

3

0.507

0.000

0.118

0.174

0.341

A figura abaixo resume as estimativas e os intervalos de confiança na figura abaixo. A curva de sobrevivência de Kaplan-Meier é mostrada como uma linha sólida, e os limites de confiança de 95% são mostrados como linhas pontilhadas.

Kaplan-Meier Curva de Sobrevivência com Intervalos de Confiança

A curva anterior de Kaplan-Meirer com sobrevivência decrescendo de 100% para 50% em 10 anos é mostrada com linhas acima e abaixo que indicam os limites de 95% de cofidence para as estimativas de sobrevivência.

Curvas de Incidência Acumulativa

Alguns investigadores preferem gerar curvas de incidência cumulativa, ao contrário das curvas de sobrevivência que mostram as probabilidades cumulativas de experimentar o evento de interesse. A incidência acumulada, ou probabilidade de falha acumulada, é calculada como 1-St e pode ser calculada facilmente a partir da tabela de vida usando a abordagem Kaplan-Meier. As probabilidades cumulativas de falha para o exemplo acima são mostradas na tabela abaixo.

Tabela de Vida com Probabilidades de Falhas Acumulativas

Tempo, Anos

Número em risco

Nt

Número de mortes

Dt

Número Censurado

Ct

Probabilidade de sobrevivência

St

Probabilidade de falha

1-St

>0

20

>1

0

1

20

1

0.950

0.050

2

19

1

0.950

0.050

3

18

1

0.897

0.103

5

17

1

0.844

0.156

6

16

1

0.844

0.156

9

15

1

0.844

0.156

10

14

1

0.844

0.156

11

13

1

0.844

0.156

12

12

1

0.844

0.156

13

11

1

0.844

0.156

14

10

1

0.760

0.240

17

9

1

1

0.676

0.324

18

7

1

0.676

0.324

19

6

1

0.676

0.324

21

5

1

0.676

0.324

23

4

1

0.507

0.493

24

3

3

0.507

0,493

A figura abaixo mostra a incidência acumulada de morte dos participantes inscritos no estudo descrito acima.

Curva de Incidência Acumulativa

O eixo Y é a incidência acumulada de óbitos de 0 a 0,6. O eixo X é o tempo ao longo de 25 anos. A probabilidade de morte aumenta de forma gradual até uma probabilidade de 0,5 a 25 anos.

Desta figura podemos estimar a probabilidade de um participante morrer até um certo ponto de tempo. Por exemplo, a probabilidade de morte é de aproximadamente 33% aos 15 anos (ver linhas tracejadas).

volta ao topo | página anterior | página seguinte

Deixe uma resposta

O seu endereço de email não será publicado.