강화학습 입문에서 Deep Q-learning 까지 다루었던 과정 내용을 Policy Gradient 까지 확장하였습니다.
현대적 강화학습의 main stream인 정책 경사 (Policy Gradient) 기본 개념 설명을 추가하였습니다.
강화학습 입문에서 Deep Q-learning 까지 다루었던 과정 내용을 Policy Gradient 까지 확장하였습니다.
현대적 강화학습의 main stream인 정책 경사 (Policy Gradient) 기본 개념 설명을 추가하였습니다.