강의 대시보드 마르코프 보상과정(MRP)
마르코프 보상과정(MRP)
강의명 : 프로그래머를 위한 강화학습(저자 직강)
수강 기한 : 무제한
진도율 : 0강/35강 (0%) | 시간 : 0분/402분
나가기
미수강
이전수업
다음수업

확률의 기댓값, 보상함수와 감가율, 반환값, 상태가치함수 개념을 이해하고 마르코프 보상과정(MRP)를 이해합니다. 

첨부파일을 참조하세요.

    목차 커뮤니티