이 강의자료는 데이터 사이언티스트 스쿨에서 사용하는 강의 교재입니다. 머신러닝 및 데이터과학 그리고 딥러닝을 다루고 있습니다.
머신러닝 입문을 위한 간단한 튜토리얼입니다. 캘리포니아 지역의 (블록내의) 집 값을 예측하는 튜토리얼이며 머신러닝 프로젝트의 시작부터 끝까지를 간단하게 보여주고 있습니다. (핸즈 온 머신러닝)
기초 확률론에 대한 수리통계학 강의자료입니다.
확률 분포에 대한 수리통계학 강의자료1 입니다.
확률 분포에 대한 수리통계학 강의자료2 입니다.
선형 대수에서 벡터 내용입니다.
선형대수 행렬 내용입니다.
Data 분석에 필요한 Numpy 기본편 입니다.
선형대수 변환 내용입니다.
선형대수 고유값/고유벡터 내용입니다.
데이터 분석에 필요한 Pandas 기본편 1 입니다.
데이터 분석에 필요한 Pandas 기본편 2 입니다.
- Data Analysis Example
- Pandas Problem Set
- Matplotlib_01 : 데이터 시각화 툴인 Matplotlib 1 입니다.
- Matplotlib_02 : 데이터 시각화 툴인 Matplotlib 1 입니다.
Gradient를 계산할 때 사용되는 기본 미적분학 강의자료입니다.
- EDA에 대한 강의 자료입니다.
- Data Science 에서 필요한 통계 내용에 대한 강의 자료1 입니다.
- Reading material
- 추정 이론 : 추정 이론에 대한 수리통계학 강의자료 입니다.
- 표본 분포 이론 : 표본 분포에 대한 수리통계학 강의자료 입니다.
- 가설 검정 이론 1 : 가설 검정 이론에 대한 수리통계학 강의자료1 입니다.
- 가설 검정 이론 2 : 가설 검정 이론에 대한 수리통계학 강의자료2 입니다.
- 분산분석 : 분산 분석(ANOVA) 대한 수리통계학 강의 자료입니다.
- 상관분석 : 상관 분석에 대한 수리통계학 강의 자료입니다.
- Python code
- Machine learning의 basic concept에 대한 강의 자료입니다.
- Reading material
- Machine Learning (Tom Mitchell)
- The Discipline of Machine Learning
Bayesian Decision Theory에 대한 강의 자료입니다.
- Lecture12 sub notes: MLE/MAP : MLE/MAP에 대한 강의 자료입니다.
- Naive Bayesian From The Scratch : Naive bayesian을 이용한 sentiment analysis 1 입니다.
- Naive Bayesian Sklearn Code : Naive bayesian을 이용한 sentiment analysis 2 입니다.
- GNB Sklearn Code : GNB를 이용하여 iris 데이터를 분류하는 예제입니다.
- Reading material
- Stanford CS229 : Generative Learning algorithms
- Pattern Recoginition and Machine Learning(Bishop): 1.5 Decision Theory (번역본있음)
- Pattern Classification(Duda) : 2. Bayesian Decision Theory (번역본있음)
Linear Regression에 대한 강의 자료입니다.
- Linear Regression Statistical models
- Linear Regression ML models
- Reading material
- A Few Useful Things to Know about Machine Learning : 머신러닝에 굉장히 유용한 논문입니다.
- Stanford CS229 : Linear Regression
Binary Classification에 대한 강의 자료입니다. (핸즈온 머신러닝)
Muticlass Classification에 대한 강의 자료입니다. (핸즈온 머신러닝)
Logistic Regression에 대한 강의 자료입니다.
- Logistic Regression Statsmodels Code
- Logistic Regression Sklearn Code
- Reading material
Decision tree에 대한 강의 자료입니다.
Ensemble method 중에서 bagging과 Random forest에 대한 강의 자료입니다.
Ensemble method 중에서 boosting과 stacking에 대한 강의 자료입니다.
- Ensemble - Boosting Python Code
- Ensemble - Stacking Python Code
- Reading material
SVM에 대한 강의 자료입니다.
- SVM Python Code : SVM Python Code 강의 자료입니다.
- Reading material
- Stanford CS229 : SVM : SVM 참고자료 입니다.
- Stanford lecture note for SMO : SMO 참고자료 입니다.
- Convex Optimization Lecture Note : Convex optimization을 정리한 내용 입니다.
- Convex Optimization Book
PCA에 대한 강의 자료입니다.
- PCA Python Code 1 : PCA from the scratch 입니다. PCA를 직접 손으로 구현해 봅니다.
- PCA Python Code 2 : Sklearn을 활용하여, PCA를 시각화하고, 적절한 주성분의 갯수를 찾는 방법에 관한 자료입니다.
- PCA Python Code 3 : Kaggle의 benz문제를 PCA를 활용하여 해결하는 자료입니다.
- Reading materials
K-means algorithms에 대한 강의 자료입니다.
- K-means Python Code 1 : K-means clustering 및 적절한 클러스터의 갯수를 찾는 방법에 관한 자료입니다.
- K-means Python Code 2 : K-means python code 입니다.
- Reading materials
- Segmentations 1 : UCI e-commerce data를 활용하여 user segmentation을 실습하는 간단한 자료입니다.
- Segmentations 2 : UCI e-commerce data를 활용하여 user segmentation을 실습하는 분석난이도가 있는 자료입니다.
Perceptron 및 Deep Neural Network에 대한 강의자료입니다.
- DNN Python Code 1 : Keras를 이용하여 기본적인 분류 및 회귀문제를 DNN을 이용하여 해결하는 예제입니다.
- DNN and Sampling Python Code 1 : Kaggle의 card fraud detection 문제를 해결하며, imbalanced 문제를 다루는 예제입니다.
- Reading material
Feature selection에 대한 강의 자료입니다.
Association Rule에 대한 강의 자료입니다.
토픽 모델링에 대한 강의 자료입니다.