최근 인공지능 분야의 놀라운 성과는 모두 강화 학습 분야에서 발표되고 있습니다. 로봇, 자율 주행 기술, 인간을 닮은 기계 등 진정한 인공 지능 기술의 혁신을 이루어 내고 있는 강화 학습 기술을 초보자의 시선으로 알기 쉽게 기초에서 고급 수준까지 다루었습니다.
Policy Gradient 추가
강화학습 입문에서 Deep Q-learning 까지 다루었던 과정 내용을 Policy Gradient 까지 확장하였습니다.
현대적 강화학습의 main stream인 정책 경사 (Policy Gradient) 기본 개념 설명을 추가하였습니다.