inflearn logo
강의

講義

知識共有

強化学習基礎理論

Markov Decision Process

강화학습 2강

369

yck9803208806

投稿した質問数 13

0

벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요

강화학습

回答 0

혹시 응용편은 어디서 볼 수 있을까요?

0

471

1

karting asset

0

434

2

using Unity.MLAgents; 오류

0

641

1

mlagents-learn --help

0

825

1

오류

0

842

1

CPU로 학습해도 충분할까요?

0

1459

1

경로 생성

0

454

2

학습 관련

0

256

1

알고리즘 관련

1

323

1

API를 통한 학습 관련

1

552

1

ml-agents 관련 질문 있습니다.

1

468

1

tf.placeholder 에러

0

528

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

441

1

안녕하세요!

0

341

1

cartpole_reinforce.ipynb 에러

0

530

2

DQN 알고리즘 실행 결과

0

357

1

슬라이드 링크

0

550

1

완성된 프로젝트 관련하여 질문 있습니다.

1

436

1

DQN 코드 에러

0

494

1

DQN 질문

0

546

1

개발환경 구축관련 문의 드립니다.

0

230

1

MDP질문

0

207

1

MDP 질문

0

266

1

backup 좀 설명해주세요.

0

201

0