Rで簡単に学ぶ強化学習

PerDQN実習

PER DQN

2020-09-22T20:35:46.975Z

242

投稿した質問数 2

강의 감사드립니다!

PER DQN 코드에서..

er<-target_Q-qvalue 한다음에 discount factor 를 er 에다가 곱하는데..

설명 해주신 식에서는 target_Q에다가 discount factor를 곱하고 (1) //

그전 state에서의 qvalue 에서 그전시점의 action에 해당하.는 값을 구하고 (2)

리워드+(1)-(2) 라고 이해했는데 코딩은 조금 다른 것 같아서요!

머신러닝 배워볼래요? R 강화학습

回答 1

coco

2020-09-25T02:06:17.761Z

안녕하세요 MQ님

아래 코드와 수식을 비교해보면 delta 변수와 TD-error가 같은 것을 확인 할 수 있습니다.

er<-target_Q-qvalue

delta<-re_ep[1]+dis_f*er[action_index]

numpy의 shape

2023-03-03T08:02:06.904Z

600

tfjs-node 안깔려서

2023-03-03T06:14:27.974Z

1113

ADP 자격증 대비 강의 개설 문의

2023-03-03T04:07:31.642Z

829

하이퍼 파라미터 튜닝 범위

2023-03-03T01:39:22.820Z

613

딥러닝 코드에 Batch Normalization 적용해보기 질문입니다

2023-03-02T07:16:11.333Z

586

flyctl 관련 재문의 드립니다.

2023-03-02T04:01:25.425Z

602

mac os ) zip 파일 dataframe 오류

2023-03-02T03:18:59.285Z

673

flyctl 배포 관련 에러 문의드립니다.

2023-03-01T16:30:38.013Z

756

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 질문입니다

2023-03-01T10:48:03.784Z

485

numpy.random.default_rng/hyperopt버젼

2023-02-28T02:19:27.471Z

1178

Binary Classfication 딥러닝 적용해보기 질문입니다

2023-02-27T13:27:15.785Z

369

업로드 후 홈화면에서 이미지가 보이지 않습니다

2023-02-27T11:04:09.882Z

591

n_iter 횟수 넘음 질문

2023-02-27T09:16:13.338Z

500

image 파일에서 vscode로 드래그 앤 드롭을 처리할 수 없다고 합니다

2023-02-27T07:53:02.874Z

1020

upload 페이지에 아무것도 안 뜨는 현상

2023-02-26T13:47:59.145Z

448

혹시 응용편은 어디서 볼 수 있을까요?

2023-02-25T12:48:43.683Z

477

[질문] 파이썬 머신러닝 완벽 가이드 교차검증-2 강의내용

2023-02-24T09:50:56.508Z

454

다차원 데이터 군집화와 시각화에 대해 질문드립니다

2023-02-24T07:40:48.450Z

562

강의 자료 부탁드립니다 !

2023-02-24T05:25:55.439Z

410

postman invalid url 질문드립니다.

2023-02-24T03:39:45.369Z

1021

hyperopt를 이용한 하이퍼파라미터 튜닝

2023-02-23T13:15:53.399Z

627

강화학습 예시로 날씨예측

2021-03-01T14:00:38.237Z

443

return_reward 함수에서

2020-08-04T06:53:20.250Z

247

강의자료와 코드에 아무것도 안뜹니다.

2020-02-16T01:00:11.613Z

213