- Kaggle Predict Student Performance from Game Play ๋ํ์ ์ฐธ์ฌํ์์ต๋๋ค.
- ์ ์ ์ ๊ฒ์ ๊ธฐ๋ก์ ์์๋๋ก ์ถ์ ํ๋ ๊ฒ์ด ํ์ต ์ํ ํ์ ์ ์ ํฉํ๋ค๊ณ ํ๋จ, sequential model์ ์ด์ฉํ๋ ๋ฐฉํฅ์ผ๋ก ์ ๊ทผํ์ต๋๋ค.
- LSTM์ ์ด์ฉํ์ฌ ์ฌ์ฉ์์ ๊ฒ์ ๋ก๊ทธ๋ฅผ embedded sequence data๋ก ๋ณํ, ์ ๋ต์ฌ๋ถ๋ฅผ ์์ธกํ์์ต๋๋ค.
- mean score ๊ธฐ๋ฐ baseline 0.65 ๋๋น LSTM์ผ๋ก CV f1-score๋ฅผ 0.67๋ก ํฅ์์์ผฐ์ต๋๋ค.
Gameplay Prediction Project
โโโ data
โ โโโ processed <- processing ๋ train, test ๋ฐ encoder, scaler ๋ฐ์ดํฐ
โ โโโ raw <- Kaggle ์์ ์ ๊ณตํ๋ Raw ๋ฐ์ดํฐ์
โ
โโโ models <- ํ๋ จ์ํจ DNN, LSTM ๋ชจ๋ธ .pt ํ์ผ
โโโ EDA_notebook <- Exploratory Data Analysis (EDA) ์งํํ Jupyter notebook
โ
โโโ requirements.txt <- ํ๋ก์ ํธ ๊ด๋ จ ๊ฐ์ํ๊ฒฝ ์ค์ (ํจํค์ง)
โ
โโโ src <- Source code for use in this project.
โ
โโโ data
โ โโโ dataloader.py <- ๋ชจ๋ธ์ ๋ฃ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ด๋ จ ์ฝ๋
โ
โโโ models
โ โ
โ โโโ criterion.py <- loss ๊ณ์ฐ
โ โโโ metric.py <- ์ฑ๋ฅ์งํ ๊ณ์ฐ
โ โโโ model.py <- import ํ ๋ชจ๋ธ์ ๋ชจ์
โ โโโ optimizer.py <- Adam ๋ฑ optimizer ๋ชจ์
โ โโโ scheduler.py <- ํ์ต ์ค์ผ์ฅด๋ฌ ๋ชจ์
โ โโโ trainer.py <- ๋ชจ๋ธ ํ๋ จ, ๊ฒ์ฆ ์คํฌ๋ฆฝํธ
โ
โโโ args.py <- parse ํ argument ๋ชจ์
โ
โโโ train.py <- ์คํ ์ฝ๋ (main)
โ
โโโ utils.py <- ๋ถ๊ฐ ๊ธฐ๋ฅ
python src/train.py [--args]