Data Science para a comunidade. O Estudo sobre a evolução da Pandemia Covid-19.

Atualmente o tema que está na ordem do dia é o Covid-19 no Mundo, onde tem surgido quantidades consideráveis de dados novos sobre esta Pandemia. É neste âmbito, que o recurso à Data Science (Ciência de dados) nos permite fazer todo o processo de obtenção, tratamento e visualização dos dados, gerados a partir de  diversas fontes.

Este estudo tem como objetivo demonstrar algumas capacidades das técnicas de Data Science, para se obter novos insights sobre a Pandemia de Covid-19 na Europa, China, Estados Unidos da América (EUA) e Portugal.

 

É sobre a evolução desta Pandemia de Covid-19, que João Silva (CCG/EPMQ, Machine Learning) apresenta neste link »  ESTUDO DA EVOLUÇÃO COVID-19 um conjunto de Dashboards (Conjunto de Gráficos), suportados pelas fontes de dados abertas da Johns Hopkins University (1) e da Direção geral da Saúde (2), que permite ter uma percepção mais detalhada de como a Pandemia se tem desenvolvido no mundo, nestes últimos meses.


Para a interpretação dos seis diferentes separadores, sendo cada um com um foco específico:
Summary – Contém um resumo de como a Pandemia de Covid-19 se tem desenvolvido, de maneira geral, pelo mundo.
World – Apresenta uma contextualização sobre a evolução de casos Infetados, Ativos, Recuperados, e Mortos para cada continente.
Europe – Descreve como a evolução da pandemia se está a desenvolver na Europa e nos países deste estudo.
Lockdown Countries – Tem a evolução do número de Infetados na China, Itália, França, Espanha e Portugal, bem como as datas importantes sobre medidas de contenção aplicadas aos seus habitantes (Quarentena obrigatória ou estado de Emergência).
Temperature Correlation – Tem como objetivo verificar se existe alguma relação com a evolução número de infetados com a temperatura média do país. Por exemplo, será que os países com temperatura média mais alta tem tendência a ter menos infetados do que os países com uma temperatura média mais baixa? Para já ainda não é possível saber, mas à medida que este gráfico vai tendo mais informação, mais conclusões podemos retirar.
Portugal – Apresenta o estado atual da evolução da Pandemia de Covid-19 em Portugal, com a comparação com o número de infetados em casa, internados ou em Unidades de Cuidados Intensivos. Tem também a distribuição atual de casos ativos, recuperados ou óbitos. É apresentada, igualmente, uma comparação com o número de testes efetuados ao longo do tempo, com o número de infetados. Por fim, é apresentada uma distribuição casos infetados por distrito.
Exponential Forecasting – Tem a evolução das curvas exponenciais apresentadas na publicação anterior,  bem como os seus valores previstos. Além disso, tem uma nova previsão sobre a evolução exponencial do crescimento do número de infetados para os próximos 2 dias. De referir que não são modelos de previsão, são sim comparações de evolução do número de infetados com a curva exponencial. (Se tiver acima da curva é negativo, se tiver abaixo da curva é positivo).


Até o dia corrente (31-março, 2020), o primeiro gráfico apresenta uma situação do nível da Pandemia em termos globais, seguindo-se uma análise centrada nos países mais atingidos.

O dashboard abaixo apresenta um estado de como a pandemia do Covid-19 se desenvolveu até ao dia de hoje:

Dashboard 1. Nível da Pandemia Covid-19, em termos globais.

Como sabemos, atualmente a Europa é o epicentro da pandemia do Covid-19, seguida de perto pelos Estados Unidos da América (EUA). O presente estudo centrou-se no desenvolvimento da pandemia nos principais países da europa, Portugal e EUA. Os países abrangidos pelo são: Portugal, Espanha, Itália, França, Alemanha, Reino Unido, EUA e China (para comparação no crescimento de infetados).

O objetivo foi obter a visualização do crescimento do número de infetados nos países referenciados anteriormente. Em paralelo, são realizadas algumas previsões (cujos resultados estão representados na imagem abaixo), meramente indicativas, a fim de verificar se o crescimento do número de infetados nos países segue, ou não, uma tendência exponencial.

A evolução do número de infetados nos países por cada dia em termos absolutos, a partir do primeiro dia, como a partir do 100º Infetado pode ser visualizada no gráfico seguinte:

 

Gráfico 1. Evolução de casos confirmados, a partir do 100º infetado.

 

A evolução do número de infetados, mas, neste caso, usando a escala logarítmica, de modo a facilitar a comparação entre a evolução de infetados de cada país, pode ser visualizada na imagem seguinte. Para uma visualização mais justa, foram estudados os crescimentos logarítmicos e absolutos a partir do 100º caso confirmado de Covid-19:

 

Gráfico 2. Evolução de casos confirmados, em escala logarítmica a partir do 100º infetado.

 

Podemos reparar que o crescimento dos países tende, em todos os casos, comportar-se da mesma maneira, seguindo tendências exponenciais, sendo estas mais explosivas nos casos dos Estados Unidos, Espanha e China. Nos restantes países, as curvas tendem a não ser tão explosivas. No entanto, o seu crescimento, em termos logarítmicos, encontra-se muito constante e não há ainda sinais de “abrandamento” nos seus crescimentos.

Em Portugal debate-se muito sobre a questão de capacidade dos hospitais e de camas/ventiladores disponíveis para os pacientes. O gráfico abaixo estuda a evolução do número de infetados e a quantidade de infetados que se encontra, ou em quarentena em casa, ou internado no hospital, ou, por fim, quem está internado em Unidades de Cuidados Intensivos. De momento verifica-se que a maioria dos infetados, cerca de 90% destes, se encontra em casa e que apenas 561 se encontram internados, onde se somam mais 164 infetados Internados em Unidades de Cuidados Intensivos (até 30 de Março).

 

Dashboard 2. – Evolução da Pandemia em Portugal.

 

Neste estudo, ainda foi efetuada uma pequena “previsão” sobre o crescimento dos casos de infetados nestes mesmos países, onde o objetivo é verificar a evolução da curva exponencial sobre os casos infetados. A inclinação da curva exponencial pode variar, seja pela alteração de comportamentos da população ou pela implementação de medidas de contenção pelos governos, como, por exemplo, o estado de emergência como que se verifica em Portugal ou a quarentena obrigatória para todos, como está a acontecer em Itália.

O gráfico seguinte apresenta a totalidade das previsões efetuadas:

 

Gráfico 3. Evolução esperada da curva exponencial.

Na imagem acima temos exemplos de países que estão a ter crescimentos ao nível da curva exponencial, acima da curva exponencial e abaixo da curva exponencial.

Por exemplo, Portugal e o Reino Unido apresentam um crescimento sempre ao nível abaixo da curva exponencial, o que é normal, pois no caso de Portugal, apesar de existirem medidas de contenção, o efeito das mesmas ainda não se está a representar na evolução do número de infetados.

França e Espanha já começam a ter uma tendência abaixo da curva exponencial, o que indica que as medidas de contenção já estão a fazer efeito. Embora, ainda não estão a ter o efeito esperado.

Nos EUA acontece que a evolução do número de infetados inicialmente foi superior ao da previsão exponencial, alegadamente pela desvalorizaram da propagação do Covid-19, estando este a evoluir descontroladamente.

Para concluir, a distribuição exponencial serve principalmente para verificar como vai ser a evolução do número de infetados com o Covid-19 nos próximos dias/semanas, sendo que após a introdução das medidas de contenção, a evolução deverá passar para uma curva sigmóide (3) (https://www.sciencedirect.com/topics/computer-science/sigmoid-function), à semelhança do que aconteceu com a China.

Sendo a tendência para todos os países terem uma curva sigmóide, depende principalmente dos comportamentos da População (com o Isolamento Social e Quarentena nos casos confirmados/suspeitos) e das medidas de contenção fazer com que a curva estabilize o mais rapidamente possível.

Sobre Portugal, pelos resultados apresentados, estamos a ficar abaixo da curva exponencial, o que é bastante positivo, uma vez que, desta forma, o número de infetados poderá não subir tanto como nos restantes países deste estudo (Espanha, França e Itália). No entanto, é necessário continuar a cumprir as medidas de contenção impostas pelo Governo e Profissionais de Saúde.

Por fim, e sobre o efeito das medidas de contenção, como se vê no Gráfico em Lockdown Countries, em Hubei, na China, o efeito das medidas de contenção só se começou a sentir na terceira semana de quarentena, pelo que se espera que tanto em Itália, Espanha e França, aconteça o mesmo.

 

Gráfico 4. Comparação entre a evolução do número de infetados com as datas das medidas de contenção em cada país.

 


Referências:

  1. Johns Hopkins University, disponível em: https://github.com/CSSEGISandData/COVID-19)
  2. Direção Geral da Saúde (DGS), disponível em:  https://covid19.min-saude.pt/relatorio-de-situacao/, e dados em CSV obtidos em:  https://github.com/CSSEGISandData/COVID-19
  3. https://www.sciencedirect.com/topics/computer-science/sigmoid-function

 

João Silva é Mestre em Engenharia e Gestão de Sistemas de Informação pela Universidade do Minho e Doutorando no Programa Doutoral em Tecnologias e Sistemas de Informação na Universidade do Minho. Atualmente é  Técnico de Desenvolvimento do D.I.A. EPMQ: Engineering Process Maturity and Quality. Os seus interesses de investigação incluem as áreas de tecnologias de Machine Learning e Data Science para a área da Indústria e para a área de Saúde, assim como tecnologias de Desenvolvimento de Software.

 

 


O D.I.A EPMQ  – IT Engineering Process Maturity and Quality do CCG preocupa-se com questões de investigação aplicada de processos de engenharia, de maturidade e de qualidade nos ambientes industriais e nas empresas. Aborda temáticas como engenharia de software, project management, segurança, sistemas distribuídos, big data, data science e machine learning (ML).