深層強化学習の動向調査を実施しました。

深層学習のフレームワークの一つである敵対的競合学習(GAN)を用いて、Actor-Critic法による強化学習の報酬を推定する逆強化学習を行う手法が敵対的逆強化学習です。これは敵対的競合学習(GAIL)と呼ばれています。

この文章の意味が分かることをゴールとして資料を作成しましたので共有します。



0コメント

  • 1000 / 1000