Skip to content

Repositório com as aulas e desafios do Bootcamp promovido pela Alura

Notifications You must be signed in to change notification settings

daianeklein/bootcamp-Alura

Repository files navigation

BOOTCAMP ALURA - DATA SCIENCE APLICADA | ANÁLISE DE DADOS DA SAÚDE

💻 Sobre o projeto

Este projeto contém todos os métodos do bootcamp Data Science Aplicada promovido pela Alura. Você pode conferir a página do evento aqui

O evento tem duração de 12 semanas contemplando os seguintes módulos:

Módulo 01: Python e pandas para análise de dados reais
Neste módulo vamos utilizar Python e Pandas para explorar os dados da distribuição de verba da saúde. Os desafios se iniciam da leitura dos dados com pandas até a aquisição de fontes de dados externas para enriquecer suas anáilises, simulando os desafios diários de um cientista de dados.
Projeto: Explorando dados financeiros do SUS.
Ferramentas: Python, Pandas, Matplotlib e Numpy.

Módulo 02: Visualização de dados com Seaborn e Matplotlib

Vamos mais a fundo na análise exploratória de dados utilizando Seaborn, Matplotlib, boas práticas de visualização e técnicas de Storytelling para criar insights valiosos sobre nossos dados.
Projeto: Visualização e análise de dados aplicada a saúde.
Ferramentas: Python, Pandas, Matplotlib e Seaborn.

Módulo 03: Estatística com python para análise de dados

Neste módulo vamos utilizar o Statsmodels, principal ferramenta estatística em python, para analisar uma base de dados com muita informação. Veremos como conceitos fundamentais da estatística, correlações e teste de hipóteses podem elevar as qualidades de nossas análises.
Projeto: Estatística aplicada na exploração de dados da saúde de jovens e adolescentes.
Ferramentas: Python, Pandas, Seaborn e Statsmodels.

Módulo 04: Análise de séries temporais

Este módulo tem foco na análise e previsões de séries temporais. Vamos aplicar todo conhecimento adquirido para trabalhar com esse tipo de dados cheio de particularidades, além de estudar ferramentas específicas como Prophet, desenvolvida pelo Facebook.
Projeto: Análise de séries temporais aplicado a saúde.
Ferramentas: Python, Pandas, Seaborn e Prophet.

Módulo 05: Tratamento, análise e Machine Learning aplicado

Este módulo tem como objetivo iniciar o desenvolvimento de um projeto que passará por todo workflow em Data Science, do entendimento do problema, tratamento e análise de dados até a proposta de solução desenvolvendo seu primeiro modelo de Machine Learning com Scikit-Learn.
Projeto: Data Science aplicado aos dados da COVID-19.
Ferramentas: Python, Pandas, Seaborn, Matplotlib, Numpy e Scikit-learn.

Módulo 06: Modelos, métricas e validações em Machine Learning

Nossa proposta no curso anterior foi utilizar Machine Learning, como solução. Neste curso vamos explorar novos algoritmos, métricas e técnicas de validação utilizando a biblioteca Scikit-learn de forma prática e aprofundada.
Projeto: Machine Learning aplicado aos dados da COVID-19.
Ferramentas: Python, Pandas, Seaborn, Matplotlib, Numpy e Scikit-learn.


🛠 Tecnologias

As análises foram desenvolvidos na linguagem Python, utilizando o Jupyter Notebook e suas bibliotecas.


👨‍💻 Contribuição

Sinta-se a vontade para contribuir com sugestões, dicas, melhores práticas, etc. Toda ajuda é bem-vinda 💜

💪 Como contribuir para o projeto

  1. Faça um fork do projeto.
  2. Crie uma nova branch com as suas alterações: git checkout -b my-feature
  3. Salve as alterações e crie uma mensagem de commit contando o que você fez: git commit -m "feature: My new feature"
  4. Envie as suas alterações: git push origin my-feature

Caso tenha alguma dúvida confira este guia de como contribuir no GitHub


💡Arquivo "README" disponibilizado por tgmarinho Acesse aqui: https://github.com/tgmarinho/README-ecoleta/blob/master/README.md

About

Repositório com as aulas e desafios do Bootcamp promovido pela Alura

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published