Prevendo a ocorrência de diabetes
Conjunto de dados obtido do repositório de ML da UCI/Kaggle https://www.kaggle.com/uciml/pima-indians-diabetes-database/data
Nosso trabalho:
- Tratar os dados
- Identificar a correlação entre as variáveis
- Verificar como os dados estão distribuídos
- Separar os dados em treino e teste
- Usar um classificador Naive Bayes
- Verificar a exatidão do modelo nos dados de treino e de teste
- usar métricas como matriz de confusão, precision, recall, f1-score e support
- Otimizar o modelo com Random Forest
- Criar outra versão do modelo, agora com Regressão Logística
- Fazer previsões com o modelo treinado