MNIST Classification Project

This repository demonstrates multiple classification techniques applied to the MNIST dataset—one of the most well-known datasets in machine learning. It is based on Chapter 3 of Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow by Aurélien Géron.

The project walks through binary, multiclass, multilabel, and multioutput classification, including performance metrics, error analysis, and decision threshold tuning.

Project Highlights

Binary, Multiclass, and Multilabel classification examples
Confusion matrix, precision-recall, F1 score, and ROC curve
Decision threshold tuning and precision/recall tradeoff
Comparison of classifiers: SGD, Random Forest, KNN
Cross-validation and StratifiedKFold evaluation
Error analysis using prediction visuals and score plots

Goal

To build a strong foundation in classification techniques by:

Understanding how classifiers behave under different metrics
Learning to evaluate, tune, and compare performance
Analyzing misclassifications to guide model improvements

Dataset

MNIST Dataset

Handwritten digits: 70,000 grayscale 28×28 images (0–9)
train_set: 60,000 images
test_set: 10,000 images
Classification task: predict the digit (0 to 9) from pixel data

Classification Tasks Covered

Task	Description
Binary Classification	Is digit == 5? Using `SGDClassifier`
Multiclass Classification	Classify digits 0–9 using OvA and OvO strategies
Multilabel Classification	Predict multiple labels per image
Multioutput Classification	Denoising digits using autoencoder-like logic

Evaluation Techniques

Confusion Matrix
Precision, Recall, F1 Score
Cross-validation (cross_val_score, StratifiedKFold)
Decision threshold adjustment
ROC Curve and AUC Score
Top errors and visualization of confusion

Models Used

Model	Purpose
`SGDClassifier`	Fast linear classifier for baseline
`KNeighborsClassifier`	Lazy learning with proximity voting
`RandomForestClassifier`	Ensemble-based robust classification
Threshold tuning logic	Manual control over decision boundaries

Reference

Based on:

Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow
by Aurélien Géron

License

This repository is open source under the MIT License.

Created and maintained by RM Villa.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.ipynb_checkpoints		.ipynb_checkpoints
exercises		exercises
(a) MNIST Dataset.ipynb		(a) MNIST Dataset.ipynb
(b) Training a Binary Classifier.ipynb		(b) Training a Binary Classifier.ipynb
(c) Measuring Accuracy using Cross Validation.ipynb		(c) Measuring Accuracy using Cross Validation.ipynb
(d) Confusion Matrices.ipynb		(d) Confusion Matrices.ipynb
(e) Precision and Recall.ipynb		(e) Precision and Recall.ipynb
(f) ROC Curve.ipynb		(f) ROC Curve.ipynb
(g) Multiclass Cassification.ipynb		(g) Multiclass Cassification.ipynb
(h) Error Analysis.ipynb		(h) Error Analysis.ipynb
(i) Multilabel Classification.ipynb		(i) Multilabel Classification.ipynb
(j) Multioutput Classification.ipynb		(j) Multioutput Classification.ipynb
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MNIST Classification Project

Project Highlights

Goal

Dataset

Classification Tasks Covered

Evaluation Techniques

Models Used

Reference

License

About

Uh oh!

Releases

Packages

Languages

eigenlambda123/hands-on-ml-classification

Folders and files

Latest commit

History

Repository files navigation

MNIST Classification Project

Project Highlights

Goal

Dataset

Classification Tasks Covered

Evaluation Techniques

Models Used

Reference

License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages