강화학습 2강
371
yck9803208806
13 asked
0
벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요
강화학습
Answer 0
혹시 응용편은 어디서 볼 수 있을까요?
0
477
1
karting asset
0
451
2
using Unity.MLAgents; 오류
0
658
1
mlagents-learn --help
0
831
1
오류
0
851
1
CPU로 학습해도 충분할까요?
0
1471
1
경로 생성
0
465
2
학습 관련
0
263
1
알고리즘 관련
1
329
1
API를 통한 학습 관련
1
559
1
ml-agents 관련 질문 있습니다.
1
475
1
tf.placeholder 에러
0
545
1
DQN 학습 및 저장 모델 불러오기 속도 문의
1
448
1
안녕하세요!
0
343
1
cartpole_reinforce.ipynb 에러
0
547
2
DQN 알고리즘 실행 결과
0
370
1
슬라이드 링크
0
565
1
완성된 프로젝트 관련하여 질문 있습니다.
1
440
1
DQN 코드 에러
0
504
1
DQN 질문
0
560
1
개발환경 구축관련 문의 드립니다.
0
242
1
MDP질문
0
216
1
MDP 질문
0
278
1
backup 좀 설명해주세요.
0
205
0

