Deep Monte-CarloによるUNO AI feat. RLCard

概要

NTT東日本主催のプログラミングコンテスト第一回に参加した時のUNO対戦プログラム

相手の手札が見えない不確定性の高いUNOという対戦ゲームにおいてDeep Monte-Carloによる強化学習を行い、手札と相手の枚数、出されたカードの状況から行動を決定する

強化学習フレームワークとゲーム環境はRLCard (UNOの特殊ルールなどは自前で実装する必要がある)

環境構築(>=3.8.6)

pip install -r requirements.txt

学習

python src/run_dmc.py