第9回自然言語処理企画:分散型強化学習手法の最近の動向と分散計算フレームワークRayによる実装の試み
日程:2020/06/20(土)15:00 〜 17:00
募集期間:2020/05/31(日) 14:02 〜2020/06/20(土) 17:00
会場:Zoom
オンライン
主催 : AI&機械学習しよう!勉強会
募集内容 | 学生参加枠 無料 先着順 既発表者/発表予定者 無料 先着順 有料参加枠 200円(前払い) 先着順 |
---|---|
前払いについて | 前払いについての連絡先: (参加者にのみ公開されます) |
キャンセル・参加費用の払い戻しについて主催者からの説明: キャンセルの際は参加費用の払い戻しはできませんので、ご了解ください。 | |
領収データの発行: 発行する (詳しくはこちら) |
イベントの説明
この勉強会は、Zoomでのオンライン勉強会です。
・有料参加枠 200円 30名 先着順
参加費はZoom環境などの勉強会用の費用、今後シンポジウム開催時の講師謝金などに、充当させていただきたいと思います。
AI&機械学習しよう!(Do2dle)は、プログラム、システム開発の現場の人を中心にしたソース&論文輪読会を進めて、AIを作れる人を増やすことを目的とするグループです。
AIに関するホットな話題を取り入れながら情報交換できる場を作っていきます。
定期的にミートアップを開催していきます。
概要
(1) ビデオゲームAtariにおいて, State-of-the-art(SOTA)を実現した分散型強化学習手法について紹介します.
Ape-X(2018)[1], R2D2(2019)[2], MuZero(2019)[3], Agent57(2020)[4] を予定しています.
(2) 2018年にAtariのSOTAを達成したApe-X[1]を, Pythonを使った分散計算フレームワークRay[6]によって実装し, Amazon EC2上にクラスタを構築して分散計算を行う方法を解説します.
【参考資料】
[1] Horgan et al., “Distributed Prioritized Experience Replay”, ICLR2018, 2018.[2] Kapturowski et al., “Recurrent Experience Replay in Distributed Reinforcement Learning”, ICLR2019, 2019.
[3] Schrittwieser et al., “Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model”, arXiv preprint arXiv:1911.08265, 2019.
[4] Badia et al., “Agent57: Outperforming the Atari Human Benchmark”, arXiv preprint arXiv:2003.13350, 2020.
[5] Sutton et al., “Reinforcement Learning: An Introduction second edition”, MIT Press, 2018.
[6] The Ray Team, “Ray – Fast and Simple Distributed Computing”, 2020.
タイムスケジュール
- 14:55 ~ 開場
- 15:00 ~ 16:30 説明(途中10分ほど休憩あり)
- 16:30 ~ 17:00 質疑応答、自由討論
- 17:00 終了
会場
開催日前にアクセス方法など注意事項はご連絡いたします。
また、Zoomパーフェクトマニュアルがあります。
今後色々なところでオンラインイベントが行われるようになると思います。
参考にしていただければ幸いです。
https://zoomy.info/zoom_perfect_manual/
参加費
- 一部有料200円