
- 미해결
벨만 방정식 질문
2강 29분정도에 law of iterated expectation에 의해서 v가 Expectation에 들어갈 수 있다고 하는데 어떻게 전개가 되는지 궁금합니다.
강화학습kyungbeom8
・
0
396
1
- 미해결
강화학습 2강
벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요
강화학습윤창규
・
0
362
0
- 미해결
backup 좀 설명해주세요.
backup 좀 설명 부탁드려요.
강화학습Sungick Kim
・
0
195
0






