[PyData Global 2021] Know Your Data First: An Introduction to Exploratory Data Analysis

This is a hands-on tutorial that introduces comprehensive Exploratory Data Analysis (EDA) techniques to have better understandings about your data before doing serious tasks such as machine-learning or deep-learning.

Target Audience

Student who wants to be a data scientist
Junior data scientist
Machine-learning researcher

Prerequisite

Some experiences with
- Python
- Pandas
- Matplotlib
- Jupyter Notebook (or similar)
GitHub & Google accounts
Fork this repo then go to: https://colab.research.google.com/github/{your_github_id}/pydata2021-eda/

Outline

Introduction
Data loading and preprocessing
- Loading a csv file
- Merging many csv files
- Essential check: #Samples, Column Names, Unique Values, Missing Values, etc.
- sidetable
- Preprocessing & Feture Engineering
  - Handling missing values
  - Extracting features
Statistical Visualizations
- matplotlib: basic building block, essential for fine-tuning
- pandas: data manipulation + plotting
- seaborn: handy matplotlib wrapper for statistical visualizations
(Easy Enough) Interactive Visualizations
- ipywidgets
- plot.ly and plot.ly express
- bokeh
- altair
Automatic EDA Report
- dtale
- pandas-profiling
- sweetviz
- autoviz
Wrap-up and Some Tips

Contact

Sin-seok SEO @Safran Tech, Safran SA

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
data		data
image		image
notebook		notebook
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
slides.pdf		slides.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

[PyData Global 2021] Know Your Data First: An Introduction to Exploratory Data Analysis

Target Audience

Prerequisite

Outline

Contact

About

Releases

Packages

Languages

jyoti-bhogal/pydata2021-eda

Folders and files

Latest commit

History

Repository files navigation

[PyData Global 2021] Know Your Data First: An Introduction to Exploratory Data Analysis

Target Audience

Prerequisite

Outline

Contact

About

Resources

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages