Estadísticas COVID-19, cuidado con los sesgos!

curvas de contagiados por habitante según los días transcurridos

Hay que ser cuidadoso a la hora de comparar el desempeño de países respecto del Coronavirus!

En los últimos días estamos inundados con información, noticias y toda clase de datos de la pandemia, incluyendo una gran cantidad de noticias falsas (fake news).

En este post me quiero centrar en un aspecto que me parece relevante a la hora de analizar y entender esa información, me refiero a las estadísticas y los gráficos que circulan por la web, algunos francamente malos y muchos otros con sesgos importantes, sobre todo a la hora de utilizarlos para comparar estrategias de contención y salud entre países, en los cuales habitualmente se usan las métricas de casos por habitante (contagios/millón de habitantes) versus días transcurridos desde el primer contagio. Aquí un ejemplo como hay muchos otros.

Sitio que permite comparar países e contagiados por dia

Primero, quiero declarar que no soy un experto en materias epidemiológicas y de políticas públicas de salud, pero si, algo entiendo de estadísticas y me parece relevante que a la hora de mirar ciertos gráficos y estadísticas tengamos en cuenta algunos elementos.  Me refiero a los sesgos que estos tienen.

Aquí me atrevo a poner de relieve algunos factores que llevan a generar sesgos al momento de comparar la situación entre países, no son los únicos por cierto, pero me parecen que son relevantes. Partamos primero por los factores asociados a comparar poblaciones muy heterogéneas.

  • Clima, muchos de los países con los que nos comparamos corresponden a países ubicados en el hemisferio norte y por lo tanto se encuentran en una estación diferente a los de esta región, la crisis les llegó en pleno invierno. Nosotros, recién estamos entrando en otoño, y aún no nos llega la estación complicada para todos las enfermedades respiratorias, me refiero a los meses de mayo, junio y julio.
  • Distribución de la población, la distribución etaria de nuestros países es muy diferente a la de los países europeos, por ejemplo España, Italia, quienes en términos de cantidad de población de riesgo, esto es, mayores a 70 años es mucho mayor que la existente en nuestros países y por lo tanto hay un segmento vulnerable mucho mayor.
  • Segmentos socio-económicos, en algunos países de la región, existe una cantidad más significativa de contagiados pertenecientes a grupos socioeconómicos más acomodados y el inicio de los contagios se produjo en zonas de mayores ingresos, ya que cuando se inició correspondía a personas que venían regresando de viajes de países de Asia y Europa con altas tasas de contagios.  En la medida que esto llegue a segmentos vulnerables de la población el problema va a ser mucho más complejo, debido a un menor acceso a la salud, menos metros cuadrados por habitante, lo que aumento el riesgo de contagio.
  • Cantidad de información, en la medida que pasan los días contamos cada vez con más información respecto de los diferentes aspectos que esta pandemia tiene (salud, económicos, sociales y otros) de esta pandemia, lo que permite tomar decisiones más informadas y con mayor evidencia sobre la mesa.  En los países en que partió esto, como es el caso de China y Corea del Sur la cantidad de información existente en ese momento era significativamente menor y por lo tanto el margen de error a la hora de tomar decisiones era mucho mayor.
  • Finalmente un sesgo por si mismo, me refiero a la Cantidad de test por habitante, en nuestros países aún la cantidad de test por habitantes es muy baja y obviamente, si el país tiene menos cantidad de chequeos su relación de contagiados/habitante va a ser menor, pero no por ello es que existen menos contagiados.

Estos factores, así como el sesgo de la cantidad de tests respecto de los datos del COVID-19 es un tema que está empezando a preocupar a diferentes áreas, aquí la visión de Michael Brand, científico de datos, que muestra con buenos ejemplos, una serie de sesgos cuando se trata de gráficas y estadísticas del Coronavirus.

YouTube

Al cargar el vídeo, acepta la política de privacidad de YouTube.
Más información

Cargar vídeo

Les dejo este otro video con ejemplos adicionales de sesgos en esto de la gráficas y estadísticas del Coronavirus, gracias a Victor Rocha por su aporte.

YouTube

Al cargar el vídeo, acepta la política de privacidad de YouTube.
Más información

Cargar vídeo

Es importante tener presentes estos factores y sesgos al momento de analizar estadísticas y gráficas qué recibimos a cada minuto por la prensa y las redes sociales.  Entendiendo que no resulta fácil determinar y estimarlos, mi sugerencia es tenerlos presentes, ya que creo que nos veríamos bastante peor en la foto si estos se incorporaran.

Comparte este artículo en

4 comentarios

  1. Hola Alejandro,totalmente de acuerdo. Agregaría a los sesgos que enumeras el sesgo relativo a la densidad poblacional. A mayores niveles de densidad demográfica, mayores niveles de contagio.
    Si sirve de algo, y dadas las limitaciones de la información que se maneja (diferentes metodologías para contabilizar defunciones en distintos países, diferentes estrategias de testeo, etc), lo central pareciera ser mirar las tasas de crecimiento, suponiendo que si bien los criterios de medición de un país a otro cambian, en cada país el criterio se mantiene estable y no influye mayormente en la tasa (aunque evidentemente sí lo hace en los números absolutos)

  2. Hola Juanita, gracias por tu comentario, efectivamente ese es un sesgo relevante. Lo que me llama la atención es que cuando se hacen comparaciones entre países con todos estos elementos de por medio no se pongan al menos como discalimer

    Saludos

    Alejandro

Deja un comentario:

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Blog eL ABC de Alejandro Barros

Suscríbete a newsletter

En este espacio reflexiono sobre Modernización del Estado, Innovación Pública, Desarrollo Digital, tecnologías de información y otras yerbas.