rl-example

An example of how to use torch-rl.

Black Jack

BlackJack is an example MDP that gives you an idea of how to implement a non-trival MDP.

Some simple scripts you can run:

visualize_montecarlo_results.lua - See the Q-function and policy that Monte Carlo Learns.
test_montecarlo.lua - See how Monte Carlo Control does on BlackJack and TestMdp.
test_tablesarsa.lua - See how Table-Lookup Sarsa Lambda does on BlackJack and TestMdp.
test_thresholdpolicy.lua - See how a super simple policy does on BlackJack.

This MDP is based on Easy 21 by Johannes.

Visualization

The plot below shows the (greedy) policy that Monte Carlo learns. It shows what the best action (z axis) to take is given a state (xy axis)A value of 1 means the player should "hit", and 2 means that the player should "stick".

The plot below shows the learned value of different states.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
images		images
test		test
.gitignore		.gitignore
BlackJack.lua		BlackJack.lua
BlackJackBoxSAFE.lua		BlackJackBoxSAFE.lua
BlackJackOneHotSAFE.lua		BlackJackOneHotSAFE.lua
BlackJackQVAnalyzer.lua		BlackJackQVAnalyzer.lua
BlackJack_constants.lua		BlackJack_constants.lua
Q_mc_ref.dat		Q_mc_ref.dat
README.md		README.md
ThresholdPolicy.lua		ThresholdPolicy.lua
analyze_lin_sarsa.lua		analyze_lin_sarsa.lua
analyze_nn_sarsa.lua		analyze_nn_sarsa.lua
analyze_sarsa.lua		analyze_sarsa.lua
analyze_table_sarsa.lua		analyze_table_sarsa.lua
generate_q_mc.lua		generate_q_mc.lua
run_tests.lua		run_tests.lua
test_montecarlo.lua		test_montecarlo.lua
test_tablesarsa.lua		test_tablesarsa.lua
test_thresholdpolicy.lua		test_thresholdpolicy.lua
visualize_montecarlo_results.lua		visualize_montecarlo_results.lua

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rl-example

Black Jack

Visualization

About

Releases

Packages

Languages

vitchyr/rl-example

Folders and files

Latest commit

History

Repository files navigation

rl-example

Black Jack

Visualization

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages