DS 101

Introduction to Data Science with Python

Описание

Цель этого воркшопа показать, что data science с правильный набором инструментов гораздо более доступная сфера деятельности, чем может казаться на первый взгляд. Мы ознакомся с тем, как обрабатывать данные, строить модели и оценивать их эффективность. Во второй половине мы попробуем поработать над некоторыми датасетами в группах. К концу воркшопа вы выйдете с твердым пониманием необходимых инструментов и основ data science.

Цели

Начнем мы с простых примеров обработки сырых данных и получение из них инсайтов. Для этого мы будем использовать библиотеку Pandas, которая де-факто стала стандартом индустрии.

После того, как мы получим понимание того, что собой представляют наши данные, мы начнем процесс построение моделей. Используя Scikit Learn, мы рассмотрим то, как построить модель и оценить ее точность для использования в реальных приложения.

Наконец, иметь рабочую модель, которая хорошо описывает данные, не достаточно. Необходимо, как-то представить полученные инсайты более широкому кругу, для этого мы рассмотрим способы визуализации данных.

Необходимые знание

Базовое понимание Python
Понимание основ математики и статистики
Любопытство и желание работать

Инструкции по установке

Скачайте соответствующий вашей системе файл установки (выбирайте версию Python 3.5) http://conda.pydata.org/miniconda.html.
Процесс установки Miniconda для вашей системы описан здесь http://conda.pydata.org/docs/install/quick.html.
Для проверки правильности установки conda наберите в командной строке: “conda list”, вы должны увидеть список установленных пакетов.
Если у вас не установлен git, то самое время это сделать https://git-scm.com/downloads, https://git-scm.com/book/en/v2/Getting-Started-Installing-Git.
Перейдите в папку в который содерится этот код, откройте термина и выполните комманду: $ conda env create
Это создаст необходимый нам environment, дальше нам нужно будет его загрузить выполнив комманду: $ source activate ds101
Все готово, осталось запустить jupyter: $ jupyter notebook

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
.jupyter		.jupyter
data		data
images		images
.gitignore		.gitignore
0-intro.ipynb		0-intro.ipynb
1-pandas.ipynb		1-pandas.ipynb
2-sklearn.ipynb		2-sklearn.ipynb
3-boston.ipynb		3-boston.ipynb
4_Titanic.ipynb		4_Titanic.ipynb
LICENSE		LICENSE
README.md		README.md
Titanic_completed.ipynb		Titanic_completed.ipynb
environment.yml		environment.yml
resources.md		resources.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DS 101

Описание

Цели

Необходимые знание

Инструкции по установке

About

Releases

Packages

Contributors 3

Languages

License

woters/ds101

Folders and files

Latest commit

History

Repository files navigation

DS 101

Описание

Цели

Необходимые знание

Инструкции по установке

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages