inflearn logo
강의

Course

Instructor

Reinforcement Learning Basics Theory

Markov Decision Process

강화학습 2강

371

yck9803208806

13 asked

0

벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요

강화학습

Answer 0

혹시 응용편은 어디서 볼 수 있을까요?

0

477

1

karting asset

0

451

2

using Unity.MLAgents; 오류

0

658

1

mlagents-learn --help

0

831

1

오류

0

851

1

CPU로 학습해도 충분할까요?

0

1471

1

경로 생성

0

465

2

학습 관련

0

263

1

알고리즘 관련

1

329

1

API를 통한 학습 관련

1

559

1

ml-agents 관련 질문 있습니다.

1

475

1

tf.placeholder 에러

0

545

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

448

1

안녕하세요!

0

343

1

cartpole_reinforce.ipynb 에러

0

547

2

DQN 알고리즘 실행 결과

0

370

1

슬라이드 링크

0

565

1

완성된 프로젝트 관련하여 질문 있습니다.

1

440

1

DQN 코드 에러

0

504

1

DQN 질문

0

560

1

개발환경 구축관련 문의 드립니다.

0

242

1

MDP질문

0

216

1

MDP 질문

0

278

1

backup 좀 설명해주세요.

0

205

0