Equipe:
Thiago Naves (Naves, T. F.) - Coordenador
Arlete Beuren (Beuren, A. T.) - Orientadora
Anderson Brilhador (Brilhador, A.) - Orientador
Nathalia de Oliveira (Oliveira, N. V. M.) - Membro Líder
Jece Neto (Neto, J. X. P.) - Membro
Guilherme Yoshida (Yoshida, G.) - Membro
Hugo de Freitas (Freitas, H. J. T) - Membro
Parceiros:
Sistema Regional de Inovação do Oeste do Paraná (SRI Iguassu Valley )
Koredata (Koredata)
Grupo: LAMIA - Laboratório de Aprendizado de Máquina e Imagens Aplicados à Indústria
Email: lamia-sh@utfpr.edu.br
Organização: Universidade Tecnológica Federal do Paraná - Campus Santa Helena
Status do Projeto: Em desenvolvimento
O projeto utiliza das tecnologias de ciência dos dados para desenvolver uma plataforma de monitoramento e análise inteligente dos dados do Covid-19 em relação a confirmados, óbitos, tipos de óbitos, suspeitos, recuperados, leitos, dentre outros dados. A plataforma possui foco maior no estado do Paraná e faz monitoramento dos demais estados do Brasil e dos países do restante do mundo. O painel também possui a finalidade de manter as pessoas informadas acerca dos avanços do coronavírus e pode ser acessado paineldadoscovid19.
O código disponível no github são dos scripts necessários para obter os dados e cadastrá-los no banco de dados, as visualizações da plataforma são desenvolvidas utilizando o Microsoft Power BI.
O objetivo principal do projeto Painel Paraná Covid-19 é monitorar de forma inteligente os dados do coronavírus prioritariamente no estado do Paraná e no restante do Brasil, com dados atualizados em tempo real e com uso de algoritmos de inteligência artificial para executar predições e construir relatórios para tomadas de decisão por parte dos órgãos públicos e privados que atuam no combate do Covid-19.
Dentre alguns dos objetivos gerais do projeto estão.
- Coletar dados sobre o Covid-19 no âmbito estadual, nacional e mundial em tempo real formando uma base de dados consistente e confiável;
- Construir esquemas de visualização da informação de modo que a interpretação dos dados seja simples e direta por parte do público;
- Monitorar a situação do coronavírus utilizando algoritmos de inteligência artificial para executar predições acerca da quantidade de pessoas e recursos médicos que serão afetados nos dias subsequentes formando conhecimento relevante;
- Gerar relatórios técnicos com tomadas de decisão para auxiliar os órgãos públicos e privados no combate ao Covid-19.
Para clonar e rodar está aplicação será necessário o Git e o Python3 instalados em sua máquina. A partir da linha de comando descrita abaixo será possível clonar este repositório.
# Clone this repository
$ git clone https://github.com/lamia-utfpr/IC02-2019-Painel-de-Dados-Covid19.git
# Go into the repository
$ cd IC02-2019-Painel-de-Dados-Covid19
Nota: Se você estiver usando Linux Bash para Windows, veja este guia ou use o prompt de comando do seu IDE.
Agora que você já está com o repositório clonado será necessário criar um virtual environment para armazenamento das bibliotecas presentes no requeriments. No diretório do projeto utilize as linhas de comando abaixo:
# Create virtualenv
$ virtualenv venv
# Execute virtual env
$ source venv/bin/activate
Com o virtual enviroment criado e sendo executado será necessário baixar as bibliotecas presentes no 'requeriments.txt'. Para isso basta utilizar o pip3 para fazer a instalação recursiva de todas as bibliotecas presentes no arquivo de texto. Certifique-se que o shell está no diretório do requeriments. Recomenda-se a utilização da execução em super usuário utilizando sudo.
# Install all requeriments
$ sudo pip3 install -r requeriments.txt
Com a criação do ambiente finalizada, configure o arquivo 'credentials.json' com as credenciais de seu banco de dados e voilà! É só rodar o arquivo 'main.py' para inserir todas as bases em seu banco de dados. É importante lembrar que não se utilize nenhum lint do Python na compilação dos algoritmos, pois o mesmo demonstra alguns bugs para importação de packages.
As bibliotecas utilizadas no projeto estão presentes no arquivo 'requeriments.txt'.
astroid==2.4.2
autopep8==1.5.3
certifi==2020.6.20
chardet==3.0.4
colorama==0.4.3
flake8==3.8.3
idna==2.10
isort==4.3.21
lazy-object-proxy==1.4.3
mccabe==0.6.1
mypy==0.782
mypy-extensions==0.4.3
numpy==1.19.0
pandas==1.0.5
psycopg2==2.8.5
pycodestyle==2.6.0
pyflakes==2.2.0
pylint==2.5.3
python-dateutil==2.8.1
pytz==2020.1
requests==2.24.0
schedule==0.6.0
six==1.15.0
SQLAlchemy==1.3.18
toml==0.10.1
typed-ast==1.4.1
typing-extensions==3.7.4.2
urllib3==1.25.9
wrapt==1.12.1
Painel Paraná Inteligente Covid-19 usa os seguintes algoritmos e tecnologias:
- Regressão Logística - executar predições;
- Regressão Linear - executar predições;
- Mínimos Quadrados - comparar predições geradas e efetuar ajustes;
- Árvores de Decisão - gerar tomadas de decisões com base em condições pré-estabelecidas;
- Tabula-py - tabula-py é um wrapper Python simples de tabula-java, que pode ler a tabelad de arquivos PDF;
- SQLAlchemy - o SQLAlchemy SQL Toolkit e o Object Relational Mapper são um conjunto abrangente de ferramentas para trabalhar com bancos de dados e Python;
- Requests - utilizada para fazer requisições HTTP pelo Python;
- Schedule - o Schedule permite executar funções Python (ou qualquer outra chamada) periodicamente em intervalos predeterminados;
- Numpy - plotagens de dados e gráficos;
- Pandas - execução de algoritmos de predição;
- Beautiful Soap - extração automática de dados.
Se você utiliza e quer citar o projeto em sua pesquisa, por favor utilize o formato de citação abaixo:
@inproceedings{LAMIA_ic02,
title={Painel Inteligente de Dados Covid-19},
author={Naves, T. F.; BEUREN, A. T.; BRILHADOR, A.},
journal={IEEE Conference on Big Data},
year={2020}
}