@sor4chi, @thirofoo, @seiei-nの3人で、深層強化学習を用いて テトリスを自動でプレイする Bot を作成しました。
高校生の頃、Youtube で テトリスの AI を遺伝的アルゴリズムで学習させる動画 にハマり、それを見て自分でも作ってみたいと思っていました。
今回、松尾研究室スプリングセミナー2024 で深層強化学習の講義を受講したので、その修了研究としてこのテーマを選びました。
今回作成した Bot は、テトリスのフィールドの状態を観測し、その状態から次にどのような操作を行うかを決定するモデルを深層強化学習で学習しました。
当プロジェクトのリポジトリは以下になります。
https://github.com/seihirochi/tetris-project実際に最終モデル (NN6) でプレイさせた様子は以下の動画でご覧いただけます。
最終的には、一晩学習させたモデルでプレイしたところ、永遠に終わらないレベルでプレイできるようになりました。
(動画ではスコアが 10M を超えているところをご覧いただけます)
色々な試行錯誤やモデルの改善を経て、最終的にはこのような結果を得ることができました。
技術的な解説は以下のスライドや @thirofooのブログ記事にまとめています。もし興味があればそちらもご覧ください。
また、最終発表に使用したスライドは以下になります。