En oncología, ¿por qué se utilizan las medianas como el medio principal para comparar dos grupos? ¿Por qué no usar el promedio?

Bueno, creo que hay dos razones principales para ello:

1) Los datos de supervivencia son muy sesgados, y la media no es una buena medida de la tendencia central en los datos sesgados. Supongamos que estamos midiendo la tasa de supervivencia, por ejemplo, en el cáncer de páncreas (PC). El cáncer de páncreas es muy agresivo, habrá mucha más gente viviendo por 2 meses que por 2 años. Esto traerá una estimación de la media muy cercana a algunos meses, lo que podría dar la impresión errónea de que la mitad de las personas morirán en unos pocos meses. Tenga en cuenta que la forma en que percibimos los valores de tendencia central (como media o mediana) es que representa alrededor de la mitad de los eventos que ocurren en ese punto. Obviamente, la mediana es un mejor estimador en este caso.

Peor aún es el caso cuando uno trata de comparar dos etapas diferentes de la PC, por ejemplo, la etapa 1A y la etapa IV. En este caso, la diferencia en la media será pequeña, no reflejando la verdadera naturaleza de que la PC metastásica (etapa IV) es mucho más fatal, y solo muy pocas personas vivirán más allá de unos pocos meses.

2) La censura de datos, que es muy común en oncología, hace que la estimación de la media sea muy sesgada, mientras que la mediana no se ve tan afectada por la censura. Citando de este artículo en psu.edu

“Por lo tanto, el comportamiento del estimador de medias Kaplan-Meier modificado depende en gran medida de la naturaleza de la distribución que se estima. Como raramente tenemos conocimiento de la verdadera distribución subyacente, se debe tener cuidado al estimar la media de los datos censurados . , las estimaciones son relativamente imparciales, pero a medida que aumenta la censura también lo hace el sesgo. Con un 30% o más de censura, el sesgo puede ser demasiado alto . Esto contrasta con el estimador Kaplan-Meier de la mediana que es relativamente imparcial.

La mediana se usa porque los investigadores no desean que los resultados sean sesgados por valores atípicos, pacientes que tienen un efecto secundario catastrófico que conduce a la muerte prematura o pacientes con respuestas excepcionales al tratamiento debido a las características únicas de su cáncer.

Mi entendimiento es que los estadísticos sienten que la mediana representa mejor la tendencia de todo el grupo.

Medidas de tendencia central

Para calcular un tiempo de supervivencia promedio para una enfermedad terminal, debe esperar hasta que pase la mayoría de los pacientes, mientras que una mediana se puede determinar tan pronto como se alcance. Por lo tanto, muchos ensayos clínicos informan una mediana ya que es procesable anteriormente.