🪧 Vitrine.Dev | |
---|---|
✨ Nome | Projeto-Pandas-Alura |
🏷️ Tecnologias | Python, Pandas, matplotlib |
🚀 URL | https://github.com/yurialcant/Projeto-Pandas-Alura |
🤿 Desafio | https://cursos.alura.com.br/course/introducao-python-pandas |
Este projeto foi criado durante o curso de introdução á biblioteca Pandas do Python, pertencente a formação Data Science, neste curso aprendemos a usar o básico da biblioteca, como funções, ler e escrever um arquivo csv e realizar o tratamento de dados, entre outras funções, aprendemos também a manipular a biblioteca matplotlib para gerar gráficos
Em nosso projeto, realizamos ele em etapas, formando assim diversos relatórios de análise de nossos dados. Em nosso primeiro relatório de dados aprendemos a abrir e realizar a leitura de um arquivo csv, através do "read_csv", especificando o caminho do arquivo e o separador necessário para realizar a leitura, e aprendemos a visualizar nosso dados, como um Data Frame.Em seguida aprendemos a visualizar as informaçãos gerais, como o tipo de nossos dados e a quantidade de registro.
Em nosso segundo relatório, primeiro aprendemos a revomer entradas duplicadas da nossa base de dados através do comando "drop_duplicates" colocando o parâmetro inplace = True, para que as mudanças realizadas sejam aplicadas no nosso DataFrame,Após isso, organizamos a visualização dos nossos Dados, criando e organizando a tabela de Ids, dos nossos tipos de imóveis.
No nosso terceiro relatório, optamos primeiro por fazer uma seleção somente dos imóveis residencais, pra gerar uma nova Base de dados somente com esse grupo, portanto criamos a variável seleção que recebe nossos dados com a função issin, após isso podemos atribuir uma nova base de dados, somente com os imóveis do tipo residencial.Com isso feito, podemos exportar essa nova base de dados para um novo arquivo csv.
No quarto relatório aprendemos a forma básica de se adicionar variáveis na nossa base de dados, conseguindo criar variáveis com operações matemáticas, envolvendo outras variáveis, já presentes na base de dados.Logo em seguida, aprendemos as funções básicas para excluir variáveis da base de dados.
Nesta estapa, aprendemos a tratar nossa base de dados, como possuímos alguns dados constando como "NaN", aprendemos a substituir esses dados faltantes para montarmos um DataFrame completo sem esses elementos faltantes. Neste relatório, aprendemos a criar agrupamentos, selecionando alguns imóveis de determinado bairros e criando um novo DataFrame, destes imóveis com a média do valor e condominio por bairro.Após isso, começamos a utilizar a biblioteca matplotlib do Python, para passar esta base de dados para um gráfico de barro, utilizando a média para construir as informações de nossos gráficos.
Neste relatório continuamos a utilizar a biblioteca pandas em conjunto com a matplotlib, para gerarmos um gráfico do tipo Box-Plot, para isso precisamos remover os outliers (dados que se diferenciam drasticamente de todos os outros) de nossa base de dados, para isso criamos um limite com base no valor do imóvel e com isso prosseguimos para a fórmula do nosso gráfico.Após isso, agrupamos nossos tipos de imóveis, refizemos a fórmula e criamos um Box-Plot para cada tipo de imóvel na nossa basse de dados.
Com isso exportamos nossa nova base de dados, desta vez sem os Outliers e concluímos o projeto.