Repositório do projeto da Avaliação Global 2 (AG2) proposta no 7° período do Instituto Nacional de Telecomunicações - INATEL.
Este projeto é dedicado ao treinamento de um modelo de machine learning para a classificação de diferentes tipos de pinguins utilizando o algoritmo Decision Tree. O objetivo é desenvolver um modelo que, após ser treinado com dados específicos, possa classificar corretamente as espécies de pinguins com base nas características fornecidas.
A estrutura de diretórios do projeto é organizada da seguinte forma:
graph TD;
AG2-->utils
utils-->tratamento_dados_py["ag2_utils.py"]
AG2-->models
models-->decision_tree_py["ag2_models_training.py"]
AG2-->json
json-->dados_teste_json["test.json"]
AG2-->graphics
graphics-->grafico_acuracia_png["accuracy.png"]
AG2-->data
data-->dataset_penguins_csv["palmerpenguins.csv"]
AG2-->notebook
notebook-->visualizacao_etapas_ipynb["main.ipynb"]
AG2-->main_py["main.py"]
AG2-->requirements_txt["requirements.txt"]
A pasta utils
contém códigos que auxiliam no projeto principal. Atualmente, possui o código que trata os dados que serão entregues ao modelo. Este código também é responsável por gerar um gráfico da acurácia que o modelo atingiu na etapa de validação.
A pasta models
guarda os códigos dedicados ao treinamento e teste do modelo. O código principal nesta pasta é o que implementa a Decision Tree para a classificação de pinguins.
A pasta json
é dedicada a armazenar um arquivo .json
que possui os dados que serão utilizados para testar o modelo. Estes dados são separados do dataset principal e são formatados especificamente para a etapa de teste.
A pasta graphics
armazena o gráfico de acurácia do modelo treinado. Este gráfico é gerado durante a etapa de validação para mostrar o desempenho do modelo.
A pasta data
contém o dataset que será utilizado no projeto. Este dataset é utilizado para treinar o modelo de Decision Tree com dados reais sobre diferentes espécies de pinguins.
A pasta notebook
guarda um arquivo ipynb
que serve como um auxiliar para a visualização de cada passo do projeto. É útil para acompanhar o desenvolvimento e verificar os resultados intermediários durante o processo de modelagem.
Para configurar o ambiente e garantir que todas as dependências sejam instaladas corretamente, é necessário criar e ativar um ambiente virtual (venv
). Siga os passos abaixo:
-
Crie um ambiente virtual com o comando:
python -m venv ag2env
-
Ative o ambiente virtual:
- Windows:
.\ag2env\Scripts\activate
- Linux/macOS:
source ag2env/bin/activate
- Windows:
Com o ambiente virtual ativado, instale as dependências necessárias executando o comando abaixo:
pip install -r requirements.txt
Com o ambiente configurado e as dependências instaladas, o projeto pode ser executado com o comando abaixo:
python main.py
Este comando irá iniciar o processo de tratamento de dados, treinamento do modelo e teste, gerando os gráficos de acurácia e apresentando os resultados da classificação dos pinguins.