Guided Cost Learning

This repo is a working implementation of guided cost learning (https://arxiv.org/abs/1603.00448) for discrete action space. Currently, it supports the CartPole-v0 environment.

How to run:

$ python3.8 main.py

Description of files:

generating_expert.py: Generates an expert on CartPole, by training vanilla policy gradient, and finally stores trained trajecteries as expert samples at expert_samples.
experts/PG.py: Implementation of vanilla policy gradient. This is reused at several places.
main.py: Contains the main implementation of GCL.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
expert_samples		expert_samples
experts		experts
.gitignore		.gitignore
README.md		README.md
cost.py		cost.py
dummy_env.py		dummy_env.py
generating_expert.py		generating_expert.py
main.py		main.py
mode_env.py		mode_env.py
test.py		test.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Guided Cost Learning

How to run:

Description of files:

Results:

About

Releases

Packages

Languages

yifanli1998/guided-cost-learning

Folders and files

Latest commit

History

Repository files navigation

Guided Cost Learning

How to run:

Description of files:

Results:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages