PhraseRL

Introduction

This repository contains implementation of PhraseRL, which is introduced in the following paper:

Phrase-Level Action Reinforcement Learning for Neural Dialog Response Generation (Yamazaki and Aizawa, Findings of ACL 2021)

Preparation

Use poetry to download dependencies.

# Install dependencies
poetry install
# Download MultiWOZ data
sh bin/fetch_data.sh

Run

Supervised Learning

The model first needs to be trained with supervised learning with the following commands:

# Train DISC model
poetry shell
python bin/train.py -c configs/disc.toml -s 0 -o outputs/disc
# Test
python bin/test.py -o outputs/disc -m best_model.pt
# Displaying outputs
python bin/display_model.py -o outputs/disc -n 10 -m best_model.pt

Reinforcement Learning

To run additional training with reinforcement learning, execute the following commands:

# Train DISC model
poetry shell
python bin/policy.py -c outputs/disc/config.toml configs/rl.toml -s 0 -o outputs/disc-rl -m outputs/disc/best_model.pt
# Test
python bin/test.py -o outputs/disc-rl -m best_model.pt
# Displaying outputs
python bin/display_model.py -o outputs/disc-rl -n 10 -m best_model.pt

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
bin		bin
configs		configs
phraserl		phraserl
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PhraseRL

Introduction

Preparation

Run

Supervised Learning

Reinforcement Learning

About

Releases

Packages

Languages

Alab-NII/PhraseRL

Folders and files

Latest commit

History

Repository files navigation

PhraseRL

Introduction

Preparation

Run

Supervised Learning

Reinforcement Learning

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages