Openai gym을 이용한 강화학습 에이전트 만들기

Intermediate 4 hours 한국어 45 people

이의령, 이영무, 이웅원, 양혁렬, 김건우 RLCode


Tutorial Information

일시 : 2017년 8월 15일

시간 : 오전 10시 ~ 오후 2시

장소 : 코엑스 그랜드볼륨 2층 

신청 : https://onoffmix.com/event/107242


Brief

RLCode의 이의령, 이영무, 이웅원, 양혁렬, 김건우 입니다.
RLCode는 작년 8월에 강화학습 에이전트 만들기 프로젝트를 시작으로 팀을 구성하였습니다.
강화학습을 주제로 지금까지 프로젝트와 연구를 진행하였고 현재는 강화학습 입문서를 출판하였습니다.
이번 파이콘 때 강화학습을 기반으로 한 에이전트를 학습시키는 튜토리얼을 제안하고자 합니다.
튜토리얼 목표는 기본적인 강화학습 이론과 코드 직접 경험해볼 수 있는 기회를 만드는 것 입니다.
코드는 저희가 관리하는 레포지토리에 있는 코드를 기반으로 진행하고 이론 부분은 저희가 집필한 책 내용을 바탕으로 진행합니다. 강화학습 이론을 모두 다루지 않고 튜토리얼에 필요한 이론을 다룰 예정입니다.


Detailed description

코드는 저희가 관리하는 레포지토리에 있는 코드를 기반으로 진행하고 이론 부분은 저희가 집필한 책 내용을 바탕으로 진행하려고 합니다. 강화학습의 이론을 모두 다루지 않고 튜토리얼에 필요한 이론을 다루려고 합니다. 

그리고 저희가 관리하는 레포지토리 주소입니다.

RLCode github :  https://github.com/rlcode/reinforcement-learning

튜토리얼에서 기본적으로 다루려는 개념은 다음과 같습니다.

1. 강화학습 이란?

2. MDP, 벨만 방정식

3. 가치 이터레이션, 정책 이터레이션

4. 가치 이터레이션, 정책 이터레이션 실습

5. 살사, 큐러닝 + 코드 랩 (Grid world)

6. Approximation(딥러닝)

7. DQN + 코드랩( Grid world, Openai gym cartpole)

이론은 PPT를 작성하여 설명하고 코드는 Ipython Notebook으로 진행할 것입니다.

환경 세팅은 사전에 github에 설치법을 올려서 미리 공지할 예정이고

리눅스(우분투), 맥을 기본으로 진행할 것입니다. 물론 윈도우 환경 설치법도 있으니 참여가능합니다.

이번 튜토리얼을 통해 참가자들이 자신이 학습시킨 에이전트를 openai gym에 업로드 할 수 있도록 하고자 합니다.

참여하시기 전에 아래 가이드를 참고하셔서 환경설치를 해오시면 감사드리겠습니다.

설치법  : https://github.com/rlcode/reinforcement-learning-kr/tree/master/wiki

발표자료https://www.slideshare.net/ssuser517c25/2017-pycon-openai-gym-78875891

감사합니다.


Back to list

Sponsors

플래티넘

골드

실버

브론즈