-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
강화학습 2강
21.03.31 19:50 작성 조회수 245
0
벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요
답변을 작성해보세요.
카테고리
세부 분야
딥러닝 · 머신러닝
해결 여부
미해결
21.03.31 19:50 작성 조회수 245
0
벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요
답변을 작성해보세요.
답변 0