Skip to content

Latest commit

 

History

History
13 lines (8 loc) · 1.94 KB

README.md

File metadata and controls

13 lines (8 loc) · 1.94 KB

###INSA | Mathématiques Appliquées, Science des Données

Tutoriels de Science des Données en Python et R

Exploration Statistique

L'objectif de ces tutoriels, présentés sous forme de calepins (jupyter notebooks), est d'introduire, à l'aide de scénarios codés en R ou Python, les méthodes et techniques de la statistique ou de la Sciences des données. Ces sénarios détaillent des exemples ou cas d'usage d'analyses de données "réelles". Ce dépôt est consacré à l'exploration statistique et aux méthodes d'apprentissage non supervisée (clustering). D'autres scénarios sont proposés sur wikistat.fr ainsi que dans les dépôts de ce site. Les méthodes sont exposées dans les vignettes de wikistat.

Chaque dossier concerne un jeu de données et contient un calepin (notebooks) au format .ipynb à télécharger et ouvrir dans Jupyter.

Exemples et cas d'usage

  • GRC-carte_Visa. Exemple de Gestion de la Relaiton Client (GRC). Exploraiton multidimensionnelle: ACP, AFCM, segmentation de clientèle: classificaiton non supervisée par CAH et réallocation dynamique; représentation, interprétation des classes.
  • DiagCoro Exploration en R. ACP, AFCM, CAH, k plus proches voisins. Interprétration et représentation des classes de 270 patients ayant consulté pour douleur thoracique et présentant ou pas une insuffisance coronarienne.