인공지능 슈퍼마리오의 거의 모든것

슬라이드


https://speakerdeck.com/wonseokjung/a-dot-i-supermario-with-reinforcement-learning

발표 동영상


https://www.youtube.com/watch?v=gfOyxIbKH-Q

설명


- 구글 딥마인드가 개발한 인공지능 알파고가 이세돌 9단을 4대 1로 승리했습니다
- 알파고로 대변되는 인공지능은 강화학습+인공신경망을 사용해 학습했습니다
- 이런 좋은 퍼포먼스를 낸 심층 강화 학습은 무엇일까요?
- 사람이 정답을 알려주지 않아도 스스로 경험하며 목적을 달성하는 행동은 어떻게 진행될까요?
- 심층 강화학습을 이용해 장애물과 적을 피하며 목적을 달성하는 슈퍼마리오를 만들었습니다 이 예제를 사용해 아래 순서로 슈퍼마리오의 학습 과정을 설명드리겠습니다. 깃발을 잡는 슈퍼마리오의 과정을 재미있는 예제와 약간의 수학 수식을 통해 알려드릴 예정입니다 1. How Animals Learn
2. How Humans Learn
3. Reinforcement Learning
4. SuperMario with Reinforcement Learning


댓글

blog comments powered by Disqus

후원사 목록

다이아몬드

사파이어

플래티넘

골드

실버

커뮤니티

미디어