statsuのblog

愛知のデータサイエンティスト。自分の活動記録。主に機械学習やその周辺に技術について学んだことを記録していく予定。

強化学習

実数値遺伝的アルゴリズムで回転倒立振子の深層強化学習

実数値遺伝的アルゴリズム(Real coded genetic algorithm, 以下RCGA)を使って深層強化学習をしてみたのでその記録です。 RCGAについてはこちらの記事を参考にしてください。 st1990.hatenablog.com 以下の検証に関するコードはgithubにあげてあります。 gi…