inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

강화학습 기초 이론

Markov Decision Process

강화학습 2강

369

윤창규

작성한 질문수 13

0

벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요

강화학습

답변 0

혹시 응용편은 어디서 볼 수 있을까요?

0

470

1

karting asset

0

434

2

using Unity.MLAgents; 오류

0

639

1

mlagents-learn --help

0

824

1

오류

0

842

1

CPU로 학습해도 충분할까요?

0

1455

1

경로 생성

0

452

2

학습 관련

0

255

1

알고리즘 관련

1

321

1

API를 통한 학습 관련

1

551

1

ml-agents 관련 질문 있습니다.

1

467

1

tf.placeholder 에러

0

527

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

440

1

안녕하세요!

0

341

1

cartpole_reinforce.ipynb 에러

0

530

2

DQN 알고리즘 실행 결과

0

354

1

슬라이드 링크

0

549

1

완성된 프로젝트 관련하여 질문 있습니다.

1

435

1

DQN 코드 에러

0

493

1

DQN 질문

0

543

1

개발환경 구축관련 문의 드립니다.

0

230

1

MDP질문

0

204

1

MDP 질문

0

263

1

backup 좀 설명해주세요.

0

201

0