Las dificultades con los datos han sido una constante. Hace 15 días, un grupo de expertos pidió un examen de los fallos de España y mencionó entre sus preocupaciones los “sistemas de información sanitaria”. En España hemos usado datos del siglo pasado para una pandemia del siglo XXI. Algunos sistemas han mejorado en estos meses y las Administraciones tienen mejores indicadores. Pero la información que publica el CCAES (Centro de Coordinación de Alertas y Emergencias Sanitarias, del Ministerio de Sanidad) sigue siendo lenta, escasa y nada accesible. Es imposible saber cuántas muertes hubo en la última quincena (por culpa del retardo), o cuántas personas fueron hospitalizadas en julio o agosto (porque no existen esas series). No ofrecen apenas estadísticas por provincias y ninguna para barrios y ciudades.

El País

Em agosto passado dixem: Sei q a informática só será 1 parte da equaçom e ignoro as claves do processo mas como engº infº e defensor impenitente qualidade dos dados nom podo expressar avondo a profunda frustraçom q m produze ver q passam os meses e este problema persiste
Sem boa informaçom nom somos nada

Quando dixem isso o que menos podia imaginar seria que alguém usaria o Microsoft Excel para tratar dados importantes:

Botched Excel import may have caused loss of 15,841 UK COVID-19 cases.
Agency reportedly lost data after exceeding maximum rows for a spreadsheet.


Isto é entre trágico, cómico e próprio dumha lenda urbana.
Assessorem-se melhor, por favor.

- Usar CSV? Perfeito.
- Processar dados clave via Excel? Uh... melhor nom.

PHE was responsible for collating the test results from public and private labs, and publishing the daily updates on case count and tests performed.

In this case, the Guardian understands, one lab had sent its daily test report to PHE in the form of a CSV file – the simplest possible database format, just a list of values separated by commas. That report was then loaded into Microsoft Excel, and the new tests at the bottom were added to the main database.

But while CSV files can be any size, Microsoft Excel files can only be 1,048,576 rows long. When a CSV file longer than that is opened, the bottom rows get cut off and are no longer displayed. That means that, once the lab had performed more than a million tests, it was only a matter of time before its reports failed to be read by PHE.


Ars Technica

digo-o nom só em relaçom a processos institucionais, quem figer investigaçom científica valiosíssima no campo que for, usai BDs, nom Excel

A parte trágica é que, se se fai o que nom se deve em termos informáticos em certos âmbitos, em última instância se podem pôr vidas em risco:

In addition to understating the number of COVID cases in official statistics, the glitch also hampered contact tracing efforts because data about the missing positive tests were not passed along to contact tracers. Officials stressed that the test subjects themselves got their test results as normal.