Manipulación de datos y segunda ola de la pandemia

Las reinfecciones producen cuadros más leves o asintomáticos de COVID-19
30/08/2020
Lo que nos une no está fuera
08/09/2020

Por Manuel Alfonseca Doctor Ingeniero de Telecomunicación y Licenciado en Informática, Profesor Honorario de la Universidad Autónoma de Madrid, Publicado en el Blog Divulgación de la ciencia, el 27 de agosto de 2020

Casos declarados durante el mes de mayo de 2020 en España

Fecha España Italia
Nuevos Acumulados Diferencia Nuevos Acumulados Diferencia
 1/5 1175 215216 1872 205463
 2/5 1147 216582 1366 1965 207428 1965
 3/5 838 217466 884 1900 209328 1900
 4/5 356 218011 545 1389 210717 1389
 5/5 867 219329 1318 1221 211938 1221
 6/5 685 220325 996 1075 213013 1075
 7/5 754 221447 1122 1444 214457 1444
 8/5 1095 222857 1410 1401 215858 1401
 9/5 604 223578 721 1327 217185 1327
10/5 621 224390 812 1083 218268 1083
11/5 373 227436 3046 802 219070 802
12/5 426 228030 594 744 219814 744
13/5 439 228691 661 1402 221216 1402
14/5 506 229540 849 888 222104 888
15/5 539 230698 1158 789 223885 1781*
16/5 421 231350 652 875 224760 875
18/5 285 231606 256* 675 225435 675
19/5 295 232037 431 451 225886 451
20/5 416 232555 518 813 226699 813
21/5 344 233037 482 665 227364 665
22/5 446 234824 787 642 228006 642
23/5 361 235290 466 652 228658 652
24/5 246 235772 482 669 229327 669
25/5 132 235400 -372* 531 229858 531
26/5 194 236259 859 300 230158 300
27/5 231 236769 510 397 230555 397
28/5 182 237906 1137 584 231139 584
29/5 187 238564 658 593 231732 593
30/5 271 239228 664 516 232248 516
31/5 96 239429 201 416 232664 416

Se observará que Italia, al igual que la mayor parte de los países del mundo, considera casos nuevos los que se detectan cada día, por lo que la diferencia entre el valor acumulado de un día y el anterior coincide (casi) siempre con el número de casos nuevos, excepto en una fecha (15/5), en que se realizó un reajuste de datos.

Al principio, también el Gobierno de España proporcionaba así los datos, pero a partir de la segunda mitad del mes de abril cambiaron el criterio, distribuyendo los casos nuevos de cada día entre varios días anteriores, aduciendo que cada caso debía corresponder, no al día en que se detectaba, sino al día en que se realizó la prueba.

¿Por qué se aplicó ese criterio, (casi) único en el mundo, que por cierto dejó inservibles la mayor parte de los modelos matemáticos desarrollados durante la pandemia? No se me ocurren más que dos motivos: disimular el número de casos nuevos, haciéndolo parecer menor de lo que era; y dificultar las comparaciones con otros países. Quizá haya alguna otra razón, pero yo no soy consciente de ella, ni por qué somos el único país del mundo (que yo sepa) que lo hace así. Lamentablemente, los medios de comunicación suelen poner énfasis en el número oficial de casos nuevos declarados, y a veces no se molestan en restar los acumulados de cada día de los del día anterior, lo que proporciona un valor mucho más fiable. Así se solía decir que estábamos por debajo de 200 (o por debajo de 100) casos diarios, cuando el número real era mucho más alto (véase, por ejemplo, el 28 de mayo).

En la tabla anterior aparecen varios días señalados con un asterisco. Son días en los que la diferencia entre el número de casos acumulados presenta discrepancias, tales como ser menor que el número de casos nuevos declarados (18/5), o incluso negativo (25/5). Estas discrepancias están en los datos oficiales, y en su día se atribuyeron a reajustes de datos necesarios por la acumulación de errores en días anteriores.

Casos declarados durante parte de la llamada segunda ola de la pandemia en España:

Fecha Casos nuevos Acumulados Diferencia
13/7/20 263 256619 666
14/7/20 390 257494 875
15/7/20 580 258855 1361
16/7/20 628 260255 1400
19/7/20 685 264836 4581*
20/7/20 529 266194 1358
21/7/20 730 267551 1357
22/7/20 971 270166 2615
23/7/20 922 272421 2255
26/7/20 855 278782 6361*
27/7/20 905 280610 1828
28/7/20 1153 282641 2031
29/7/20 1229 285430 2789
30/7/20 1525 288522 3092
2/8/20 968 297054 8532*
3/8/20 1178 302814 5760
4/8/20 1772 305767 2953
5/8/20 1683 309855 4088
6/8/20 1895 314362 4507

Los asteriscos en esta tabla señalan días en los que el valor acumulado subió muy por encima de lo normal, debido a que en este mes el Ministerio dejó de presentar datos los fines de semana, por lo que los datos de tres días se acumulan en el lunes. En cualquier caso, puede verse que el número de casos nuevos diarios fue siempre muy superior al de casos nuevos declarados con el sistema de manipulación estadística adoptado por el Gobierno, pues cuando los medios nos decían que el número de casos nuevos se aproximaba a 1000 al día, en realidad andaba por encima de 2000, e incluso algún día pasó de 5000.

A la hora de comparar estos datos con los de la primera ola de la pandemia, hay que tener en cuenta que los datos actuales incluyen muchos casos asintomáticos (más de un 50%), que prácticamente brillan por su ausencia en los datos de marzo y la primera mitad de abril. Eso explica también, al menos en parte, por qué ha disminuido últimamente la tasa de fallecimientos. Lo que es vergonzoso es que el Ministerio de Sanidad siga dando 28.838 como cifra acumulada de fallecidos a fecha 25 de agosto, cuando el MoMo (datos del Centro Nacional de Epidemiología) daba el 24 de agosto una cifra mucho más fiable, 46.096, obtenida sumando los 43.556 de la primera ola, y los 2.540 de la segunda, que según sus datos dio comienzo el 27 de julio.