inflearn logo
강의

講義

知識共有

Rで簡単に学ぶ強化学習

PerDQN実習

PER DQN

237

MQ

投稿した質問数 2

0

강의 감사드립니다!

PER DQN 코드에서.. 

er<-target_Q-qvalue 한다음에 discount factor 를 er 에다가 곱하는데..

설명 해주신 식에서는 target_Q에다가 discount factor를 곱하고 (1) //

그전 state에서의 qvalue 에서 그전시점의 action에 해당하.는 값을 구하고 (2)

리워드+(1)-(2) 라고 이해했는데 코딩은 조금 다른 것 같아서요! 

머신러닝 배워볼래요? R 강화학습

回答 1

0

coco

안녕하세요 MQ님

아래 코드와  수식을 비교해보면 delta 변수와 TD-error가 같은 것을 확인 할 수 있습니다.

      er<-target_Q-qvalue

      delta<-re_ep[1]+dis_f*er[action_index]   

numpy의 shape

0

583

1

tfjs-node 안깔려서

0

1102

1

ADP 자격증 대비 강의 개설 문의

0

810

2

하이퍼 파라미터 튜닝 범위

0

608

1

딥러닝 코드에 Batch Normalization 적용해보기 질문입니다

0

580

1

flyctl 관련 재문의 드립니다.

0

594

1

mac os ) zip 파일 dataframe 오류

0

660

1

flyctl 배포 관련 에러 문의드립니다.

0

754

1

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 질문입니다

0

478

1

numpy.random.default_rng/hyperopt버젼

0

1169

1

Binary Classfication 딥러닝 적용해보기 질문입니다

0

366

1

업로드 후 홈화면에서 이미지가 보이지 않습니다

0

583

1

n_iter 횟수 넘음 질문

0

492

2

image 파일에서 vscode로 드래그 앤 드롭을 처리할 수 없다고 합니다

0

1010

1

upload 페이지에 아무것도 안 뜨는 현상

0

434

1

혹시 응용편은 어디서 볼 수 있을까요?

0

471

1

[질문] 파이썬 머신러닝 완벽 가이드 교차검증-2 강의내용

1

447

1

다차원 데이터 군집화와 시각화에 대해 질문드립니다

0

552

1

강의 자료 부탁드립니다 !

0

406

1

postman invalid url 질문드립니다.

0

1013

1

hyperopt를 이용한 하이퍼파라미터 튜닝

0

616

1

강화학습 예시로 날씨예측

0

438

1

return_reward 함수에서

0

243

3

강의자료와 코드에 아무것도 안뜹니다.

0

205

1