Reinforcement-learning (In-progress)

I'm trying to implement some reinforcement-learning algorithms. Most of my implementation based on three lectures below:

My codes are like a rewrite from Denny Britz's Repo, But because I can't write such a beautiful code like he does yet :( So I try to implement many of it by myself ;)

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
lib		lib
.gitignore		.gitignore
BlackJack_MC.py		BlackJack_MC.py
BlackJack_TD.py		BlackJack_TD.py
BlackJack_TD_lambda.py		BlackJack_TD_lambda.py
BlackJack_env.py		BlackJack_env.py
GridWorld.py		GridWorld.py
README.md		README.md
WindyGridWorld.py		WindyGridWorld.py
WindyGridWorld_TD.py		WindyGridWorld_TD.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement-learning (In-progress)

Table of contents

0. Environment

1. Dynamic Programming

2. Simple Model-Free

3. Eligibility Traces

About

Releases

Packages

Languages

rianrajagede/reinforcement-learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement-learning (In-progress)

Table of contents

0. Environment

1. Dynamic Programming

2. Simple Model-Free

3. Eligibility Traces

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages