RL-Algorithm

Implement of serval reinforcement learning algorithm

Directory Structure

Algorithm	Reference	Status
DQN	10.1038/nature14236	✅
SARSA		✅
Double DQN	10.1609/aaai.v30i1.10295	✅
Dueling DQN	10.48550/arXiv.1511.06581	✅
Rainbow DQN	10.1609/aaai.v32i1.11796
REINFORCE	10.1007/BF00992696	✅
VPG(Vanilla Policy Gradient)		✅
AC(Actor Critic)		~
A2C
A3C
DPG(Deterministic Policy Gradient)
DDPG
TRPO(Trust Region Policy Optimization)	10.5555/3045118.3045319
PPO(Proximal Policy Optimization)	arXiv:1707.06347	✅
TD3

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
algorithms		algorithms
envs		envs
test		test
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt