강의

챌린지

멘토링

클립

로드맵

강화학습 기초 이론

Markov Decision Process

강화학습 2강

2021-03-31T10:50:16.787Z

371

윤창규

작성한 질문수 13

0

벨만 방정식에서 v=R+감마Pv 에서 첫번째 v와 두번째 v는 다른 state의 value function인데 왜 v=(1-감바P)^-1R로 나타낼수 있나요? 이해가 잘안가요

강화학습

답변 0

혹시 응용편은 어디서 볼 수 있을까요?

2023-02-25T12:48:43.683Z

0

476

1

karting asset

2023-02-22T08:56:29.060Z

0

451

2

using Unity.MLAgents; 오류

2023-02-21T06:14:13.610Z

0

658

1

mlagents-learn --help

2023-02-16T02:49:29.508Z

0

831

1

오류

2023-02-09T03:04:05.727Z

0

851

1

CPU로 학습해도 충분할까요?

2023-02-06T01:05:14.307Z

0

1471

1

경로 생성

2023-01-30T12:40:09.408Z

0

465

2

학습 관련

2023-01-26T06:25:21.160Z

0

263

1

알고리즘 관련

2023-01-24T13:03:15.952Z

1

329

1

API를 통한 학습 관련

2023-01-24T12:49:23.102Z

1

559

1

ml-agents 관련 질문 있습니다.

2023-01-13T07:33:18.442Z

1

475

1

tf.placeholder 에러

2023-01-05T15:15:21.456Z

0

545

1

DQN 학습 및 저장 모델 불러오기 속도 문의

2023-01-01T14:47:00.447Z

1

448

1

안녕하세요!

2022-12-16T12:08:02.030Z

0

343

1

cartpole_reinforce.ipynb 에러

2022-12-16T04:27:27.881Z

0

547

2

DQN 알고리즘 실행 결과

2022-12-14T11:24:26.393Z

0

370

1

슬라이드 링크

2022-12-11T01:28:35.528Z

0

563

1

완성된 프로젝트 관련하여 질문 있습니다.

2022-12-09T05:13:59.886Z

1

440

1

DQN 코드 에러

2022-12-06T10:35:20.931Z

0

504

1

DQN 질문

2022-12-05T20:55:26.631Z

0

560

1

개발환경 구축관련 문의 드립니다.

2022-10-17T02:40:43.966Z

0

242

1

MDP질문

2022-10-10T06:22:44.856Z

0

216

1

MDP 질문

2022-10-09T00:50:05.085Z

0

278

1

backup 좀 설명해주세요.

2019-01-29T05:14:17.000Z

0

205

0