inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Lý thuyết cơ bản về học tăng cường

Quá trình ra quyết định của Markov

강화학습 2강

369

yck9803208806

13 câu hỏi đã được viết

0

벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요

강화학습

Câu trả lời 0

혹시 응용편은 어디서 볼 수 있을까요?

0

471

1

karting asset

0

434

2

using Unity.MLAgents; 오류

0

641

1

mlagents-learn --help

0

825

1

오류

0

842

1

CPU로 학습해도 충분할까요?

0

1459

1

경로 생성

0

454

2

학습 관련

0

256

1

알고리즘 관련

1

323

1

API를 통한 학습 관련

1

552

1

ml-agents 관련 질문 있습니다.

1

468

1

tf.placeholder 에러

0

528

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

441

1

안녕하세요!

0

341

1

cartpole_reinforce.ipynb 에러

0

530

2

DQN 알고리즘 실행 결과

0

357

1

슬라이드 링크

0

550

1

완성된 프로젝트 관련하여 질문 있습니다.

1

436

1

DQN 코드 에러

0

494

1

DQN 질문

0

546

1

개발환경 구축관련 문의 드립니다.

0

230

1

MDP질문

0

207

1

MDP 질문

0

266

1

backup 좀 설명해주세요.

0

201

0