El caos estadístico del coronavirus

La recogida y comunicación desigual de datos impide utilizar series históricas, hacer proyecciones y en definitiva, contribuir a la toma de decisiones y a la transparencia

iStock

santiago / la voz

Casos, hospitalizados, uci y fallecidos. Hasta ese punto, acuerdo. Todos los países han ido dando información sobre las mismas series desde el inicio de la pandemia. A partir de ahí, la maraña estadística. O no se comunican los mismos datos, o las definiciones no son iguales, o se han recogido de diferentes modos o el criterio cambia en mitad de la curva epidémica.

«O principal problema, xa a nivel nacional, así que imaxina o internacional, é a falta de homoxeneidade dos datos, incluso a falta de harmonización, no sentido de que non había definicións claras». Rosa Crujeiras es profesora de la Facultade de Matemáticas de la Universidade de Santiago y miembro del Comité Español de Matemáticas, que, bajo la coordinación del profesor de la UDC Ricardo Cao, lanzó Acción Matemática contra el Coronavirus, una iniciativa que, entre otras cosas, hacía predicciones colaborativas a corto plazo sobre la evolución de casos y presión hospitalaria. Y un día, cambió el sistema de recogida.

A finales de marzo, el Ministerio de Sanidad reconocía que los datos por comunidades sobre la situación hospitalaria no eran homogéneos. No se podían comparar entre sí, porque algunas comunidades enviaban cifras acumuladas desde el inicio de la pandemia mientras otras enviaban el dato del día en cuestión. Empezaban a aparecer asteriscos en unas estadísticas que al final se convirtieron en un barullo. «Temos un bo sistema de comunicación de datos, porque se reportar diariamente, pero faltou a homoxeneización e temos series que son inmanexables», explica Crujeiras.

Un ejemplo muy simple es preguntarse qué es un caso. Para Bélgica, cualquier persona con sospecha de covid-19. Se ponían en el peor de los escenarios para poder gestionar del mejor modo posible sus recursos. España cambió su definición a mitad de confinamiento, así que las series históricas no son válidas -no es lo mismo contabilizar todos los sospechosos que solo los diagnósticos por PCR que incluir otro tipo de pruebas- y Crujeiras lamenta que se han perdido para siempre.

Si los datos no son comparables -y el ministerio valida y corrige continuamente sus series- también es complicado hacer valoraciones sobre cómo se está gestionando la epidemia en cada territorio y la convierte en terreno abonado para la demagogia. La crisis del covid-19 ha demostrado un analfabetismo estadístico extendido internacionalmente en la era del big data. La información se almacena, pero la sociedad no tiene herramientas para interpretarla de forma crítica. Suiza ha lanzado una iniciativa para educar sobre el análisis de datos desde la infancia. 

La falta de información es mala, pero lo es también el exceso. «A información que damos, non a damos dixerida», lamenta Crujeiras. Es más fácil colgar un montón de datos sin dar herramientas para interpretarlos que pasar por un tamiz los datos más relevantes y explicar realmente el impacto que tienen.

«É importante ter datos para poder facer proxeccións que axuden á toma de decisións, pero hai que ter claro que é o que se mide e cales son os criterios. Iso foi algo que fallou a nivel nacional», explica Crujeiras. Y es algo que no ha pasado en otros países, como Italia, en el que el sistema de recogida era más rudimentario (con zonas en las que se realizaba a mano) pero tenían criterios unificados. Y eso en España no ocurre. De hecho, un indicador fundamental como el de las uci está cojo. «En realidade non sabemos cantas camas uci hai en España. Temos un dato do Eurostat do 2017». En Italia había datos por hospitales. Y se generaron sistemas de alarma. Rosa Crujeiras entiende la dificultad de adaptar diariamente la información. «Pero se non a tes, non axudas á toma de decisións». Y es lo que está ocurriendo en España.

Hay comunidades que ofrecen en abierto datos diarios de la evolución de los contagios por zonas básicas de salud, como Navarra. Otras permiten cruzar los datos de renta con los de incidencia, como Cataluña. Y Castilla y León ofrece la cifra de rastreadores activos por provincia. Galicia no tiene ninguna página en la que consultar datos epidemiológicos en abierto y solo ofrece un informe diario a los medios de comunicación (desagregado al nivel de área sanitaria) con casos activos (pero no de nuevos contagios), hospitalizados, ucis, fallecidos -desagregados entre hospitalizados y fallecimientos en residencias-, altas y número de PCR. Estos dos últimos, acumulados.

La desagregación es importante, destaca Crujeiras. Hasta el punto de que contar con datos prácticamente individualizados -aunque hay que buscar el equilibrio con la protección de datos- permitiría hacer análisis sobre severidad o fatalidad. La consellería ha cedido algunos datos, solo para uso de investigación.

Hay que recurrir a los informes del Ministerio de Sanidad para saber, por ejemplo, la incidencia acumulada a 14 y 7 días, la tasa de positividad de las PCR o el porcentaje de camas ocupadas por enfermos de covid en los hospitales, tres de los indicadores fundamentales que maneja el comité de seguimiento de la epidemia para tomar decisiones sobre los brotes que se van produciendo en la comunidad. También Galicia ha ido cambiando de criterio a medida que avanzaba la pandemia, por ejemplo en lo que a número de altas se refiere. Al principio solo se comunicaban altas hospitalarias. Fue a finales de marzo cuando se empezaron a considerar altas epidemiológicas.

Homogeneizar, armonizar y aportar nuevos datos, propuestas de mejora

La comunidad científica tiene claro que la situación es mejorable. Primero, es necesario armonizar, es decir, que todo el mundo recolecte datos bajo los mismos criterios. Después hay que homogeneizar las estadísticas y abrirse a nuevas series interesantes. «Sabemos como evoluciona a pandemia no tempo, pero non temos ben modelado como evoluciona a pandemia no espazo», explica Crujeiras.

Para eso son fundamentales los datos de movilidad, que fueron liberados en el mes de junio, con lo que había información sobre cómo se desplazan las poblaciones, una información que se puede incorporar a los modelos. «Estamos vendo que non é a mesma a evolución dunhas zonas e outras. E teño a sensación de que quedamos ancorados en como van as curvas de casos e non fomos máis aló», también por una cuestión social. La profesora de Matemáticas de la USC se pregunta si «as nosas autoridades cren que isto pode servir para algo?».

Se están dando pasos. Crujeiras es representante de un grupo internacional en la Federación Europea de Sociedades de Estadística, donde se ha formado un gran grupo, en el que está presente el Banco Central Europeo y en el que se está trabajando en una propuesta de homogeneización de datos contactando co Eurostat.

Y es interesante, en el caso de la incidencia, continuar por la vía de la presencia del virus en las aguas residuales. En Galicia y en España hay proyectos en este sentido, pero Portugal ha ido un paso más allá y, coordinado desde la Universidad de Lisboa tiene una investigación a nivel nacional sobre lo que aporta este indicador.

«Las matemáticas ayudan a predecir, pero también a prevenir pandemias»

susana luaña

Ahora trabaja en pronósticos del covid-19 a través de las redes sociales

El catedrático de Análisis Matemático Juan José Nieto Roig (A Coruña, 1958) ya era uno de los investigadores más reconocidos y más citados en su campo, pero el trabajo que coordinó para predecir con exactitud la curva y el pico de la pandemia del coronavirus lo convirtió en un personaje mediático.

-¿Cómo lleva la fama?

-Pues mal. Cuando mis hijos me veían en la televisión decían que no parecía que estuviese nervioso, pero lo cierto es que lo estaba y sudaba y lo pasaba mal, pero informar a la opinión pública también entra entre nuestras obligaciones.

Seguir leyendo

Conoce toda nuestra oferta de newsletters

Hemos creado para ti una selección de contenidos para que los recibas cómodamente en tu correo electrónico. Descubre nuestro nuevo servicio.

Votación
37 votos
Comentarios

El caos estadístico del coronavirus