$ git clone https://github.com/thimyxuan/weekly-sales-store-predictions.git
$ pip install library_name
Pour utiliser ce projet vous aurez besoin d'installer les librairies ci-dessous.
- Python
- Numpy
- Pandas
- Matplotlib
- Seaborn
- Sklearn
Dans le but d'améliorer ses campagnes marketing, Walmart souhaite avoir des estimations précises sur les ventes hebdomadaires de ses différents magasins. De plus, l'entreprise désire mieux comprendre les facteurs économiques qui influencent ses ventes.
Dans cette étude nous analysons l'historique des ventes hebdomadaires des différents magasins en parallèle avec les indicateurs économiques. Puis nous créons un modèle de prédiction à partir de ces données.
Le but :
- Utiliser l'EDA pour comprendre les facteurs économiques qui influencent les ventes des magasins Walmart
- Utiliser les techniques de machine learning supervisé pour prédire le chiffre d'affaires hebdomadaire des magasins Walmart
PARTIE 1 - EDA & prétraitement des données
- Lecture et sélection des données
- Nettoyage (données manquantes, valeurs aberrantes)
- Analyse des données, visualisations
- Matrices de corrélation
PARTIE 2 - Modèle de régression linéaire de base
- Preprocessings Sklearn
- Entraînement du modèle et prédictions
- Résultats et performance
- Importance des features
PARTIE 3 - Modèle de régression linéaire régularisé
- Modèle Ridge (partie A) et (partie B) Lasso
- Recherche des meilleurs hyperparamètres
- Entraînement des modèles et prédictions
- Résultats et performance
PARTIE 4 - Conclusion