Prática Padrão das petalas e sepálas.
KMeans é um aprendizado não supervisionado que é utilizado para:
- segmentação do mercado;
- agrupamento de clientes em potencial
- agrupamento de caracteristicas de clientes
- produtos mais similares
- agrupar perfis de clientes
Kmeans - versão com comentários sobre as bibliotecas e métodos usados. Aconselhado para estudantes.
KMeans_ClearVersion - versão só com a aplicação.
Parametros:
n_clusters
random_state :determina um numero de randomico para gerar o centroide
Atributos:
cluster_centers_ : coordenadas do centro do cluster
inertia_: a soma do quadrado das distancias das amostras mais pertas dos centroides do cluster
Metodos:
.fit(): calcula os clusters
.fit_prediction(): calcula os centróides
- Importação das bibliotecas Pandas, Numpy, Plotly Express e Graph Objects, Sklearn Preprocessing (StandardScaler) e Sklearn Cluster (KMeans)
- Informar a base de dados
- Conhecendo a base de dados (head, shape, describe, unique)
- Separando a prática em duas fase: petalas e sepalas
- Realizar agrupamento pelas petalas
- Normalizando os dados usando StandardScaler e ajustá-los e transformá-los (.fit_transform)
- Calculando o numero de clusters
- Criando gráfico do cotovelo
- Gráfico de agrupamento
- Passos 5 a 9 repetidos, agora para as sepalas.
https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html
https://scikit-learn.org/dev/modules/clustering.html#k-means
Agradecimento ao Prof Leandro Lessa pelo aprendizado. Repositório original: https://github.com/ProfLeandroLessa/FDA-material-video-aulas
Aulas ofertadas pela IGTI (atual XP Educação) em parceria com o Banco Pan
Alterações e acrescimos: Lidiane Aureliano https://github.com/laurelianox