RL Adventure : DQN 부터 Rainbow DQN까지

Experienced 4 hours 한국어 30 명

양홍선

참가신청하기

Tutorial Information

일시 : 2018-08-17 10:00:00 ~ 2018-08-17 14:00:00

Brief

Reinforcement Learning Korea에서 HomeNavi project를 통해서 만나게된, 강화학습에 관심이 있는 이의령, 성태경, 양홍선 그리고 김예찬 입니다.
Navigation 문제를 Reinforcement Learning으로 풀기 위해 노력하고 있습니다. 그 과정에서 공부한 내용들을 공유해보려고 합니다.

Detailed description

# 튜토리얼 목표 :

- 모두의 강화학습 강의도 들었고, DQN코드도 실습해봤지만, 비교적 최신 이론에 대한 공부가 필요하다!

- 일단 논문을 직관적으로 이해하고, 구현된 코드를 내것으로 만들고 싶다!

위에 해당하는 분들을 대상으로 DQN부터 Rainbow DQN까지 논문과 코드 리뷰를 진행합니다.

튜토리얼의 진행 방식은 다음과 같습니다.

1. 논문을 쭉 한번 살펴본다.

2. 저자가 어떠한 문제를 풀고싶어하는지 파악한다.

3. 문제 접근방법의 하이레벨의 핵심 아이디어를 파악한다.

4. 코드를 본다(디테일한 증명은 스킵한다)

5. 디테일한 증명과 수식을 살펴본다.

각 논문별로 1~4번까지 하는 것을 목표로 합니다.

Pytorch 구현체를 기반으로 논문 개념과 코드에 대한 이해를 할 수 있도록 진행합니다.

다음 레포지토리를 기반으로 진행합니다. (한글 번역 작업 예정)

https://github.com/higgsfield/RL-Adventure

# Rainbow의 구성요소 논문

- double (https://arxiv.org/abs/1509.06461)

- dueling (https://arxiv.org/abs/1511.06581)

- PER (https://arxiv.org/abs/1511.05952)

- Noisy (https://arxiv.org/abs/1706.10295)

- C51 (https://arxiv.org/pdf/1707.06887.pdf)

- RainbowDQN (https://arxiv.org/abs/1710.02298)

# 참가 대상 : 강화학습에 대한 기초 개념이 있으신 분

Sponsors

다이아몬드

사파이어

플래티넘

골드

실버

커뮤니티

미디어