강화 학습 입문

연세대학교 인공지능 학회 YAI 연구부원 겨울방학 “기계/로봇 제어 프로젝트”

작성자 : 장민준

Introduction

기계 및 로봇 제어 프로젝트 팀으로 배정을 받았지만 실제로 강화학습에 대한 공부를 한 적이 없어 부족함을 느꼈고 팀원 모두 실제 코드를 짜본 경험이 부족하다고 동의하여 약 2~3주 간 실습 위주의 강화학습 기초 교재를 보며 공부한 후 프로젝트를 진행하기로 결정하였다.

여러 교재 후보 중 실습 위주로 구성된 ‘Do It! 강화 학습 입문’ 교재를 선택하여 빠르게 4장 Deepracer로 구현한 자율주행 부분까지 공부한 이후 프로젝트를 진행하게 되었다.

Untitled

프로젝트는 본인이 현재 참여하는 프로젝트에서 실제 Deepracer 기기를 사용하는 연구실이 있어 본 프로젝트와 연관지어 실습을 진행해볼 수 있을 것이라 판단하여 Deepracer 자율주행 구푹 관련 프로젝트를 진행하는 것으로 결정하였다. Deepracer 기기 이용 이전에 AWS에서 제공하는 웹 상의 시뮬레이션 모델을 이용하여 프로젝트를 진행한 뒤 마지막에 실제 기기에 올려 구동해보는 방식으로 진행할 예정이다. (https://aws.amazon.com/ko/deepracer/)

4주차 - Deepracer Simulation

5주차 - Deepracer Reward Function

6주차 - Deepracer Reward Function Tuning

Do-it-Reinforcement-Learning, 2021, 조규남, 맹윤호, 임지순