RL Adventure : DQN 부터 Rainbow DQN까지
Experienced 4 hours 한국어 30 명
양홍선
참가신청하기
Tutorial Information
일시 : 2018-08-17 10:00:00 ~ 2018-08-17 14:00:00
Brief
Reinforcement Learning Korea에서 HomeNavi project를 통해서 만나게된, 강화학습에 관심이 있는 이의령, 성태경, 양홍선 그리고 김예찬 입니다.
Navigation 문제를 Reinforcement Learning으로 풀기 위해 노력하고 있습니다. 그 과정에서 공부한 내용들을 공유해보려고 합니다.
Detailed description
# 튜토리얼 목표 :
- 모두의 강화학습 강의도 들었고, DQN코드도 실습해봤지만, 비교적 최신 이론에 대한 공부가 필요하다!
- 일단 논문을 직관적으로 이해하고, 구현된 코드를 내것으로 만들고 싶다!
위에 해당하는 분들을 대상으로 DQN부터 Rainbow DQN까지 논문과 코드 리뷰를 진행합니다.
튜토리얼의 진행 방식은 다음과 같습니다.
1. 논문을 쭉 한번 살펴본다.
2. 저자가 어떠한 문제를 풀고싶어하는지 파악한다.
3. 문제 접근방법의 하이레벨의 핵심 아이디어를 파악한다.
4. 코드를 본다(디테일한 증명은 스킵한다)
5. 디테일한 증명과 수식을 살펴본다.
각 논문별로 1~4번까지 하는 것을 목표로 합니다.
Pytorch 구현체를 기반으로 논문 개념과 코드에 대한 이해를 할 수 있도록 진행합니다.
다음 레포지토리를 기반으로 진행합니다. (한글 번역 작업 예정)
https://github.com/higgsfield/RL-Adventure
# Rainbow의 구성요소 논문
- double (https://arxiv.org/abs/1509.06461)
- dueling (https://arxiv.org/abs/1511.06581)
- PER (https://arxiv.org/abs/1511.05952)
- Noisy (https://arxiv.org/abs/1706.10295)
- C51 (https://arxiv.org/pdf/1707.06887.pdf)
- RainbowDQN (https://arxiv.org/abs/1710.02298)
# 참가 대상 : 강화학습에 대한 기초 개념이 있으신 분
Back to list