강화학습 2강
369
윤창규
작성한 질문수 13
0
벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요
답변 0
혹시 응용편은 어디서 볼 수 있을까요?
0
470
1
karting asset
0
434
2
using Unity.MLAgents; 오류
0
639
1
mlagents-learn --help
0
824
1
오류
0
842
1
CPU로 학습해도 충분할까요?
0
1455
1
경로 생성
0
452
2
학습 관련
0
255
1
알고리즘 관련
1
321
1
API를 통한 학습 관련
1
551
1
ml-agents 관련 질문 있습니다.
1
467
1
tf.placeholder 에러
0
527
1
DQN 학습 및 저장 모델 불러오기 속도 문의
1
440
1
안녕하세요!
0
341
1
cartpole_reinforce.ipynb 에러
0
530
2
DQN 알고리즘 실행 결과
0
354
1
슬라이드 링크
0
549
1
완성된 프로젝트 관련하여 질문 있습니다.
1
435
1
DQN 코드 에러
0
493
1
DQN 질문
0
543
1
개발환경 구축관련 문의 드립니다.
0
230
1
MDP질문
0
204
1
MDP 질문
0
263
1
backup 좀 설명해주세요.
0
201
0





