inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 쉽게 배우는 강화학습

PerDQN 실습

PER DQN

237

MQ

작성한 질문수 2

0

강의 감사드립니다!

PER DQN 코드에서.. 

er<-target_Q-qvalue 한다음에 discount factor 를 er 에다가 곱하는데..

설명 해주신 식에서는 target_Q에다가 discount factor를 곱하고 (1) //

그전 state에서의 qvalue 에서 그전시점의 action에 해당하.는 값을 구하고 (2)

리워드+(1)-(2) 라고 이해했는데 코딩은 조금 다른 것 같아서요! 

머신러닝 배워볼래요? R 강화학습

답변 1

0

코코

안녕하세요 MQ님

아래 코드와  수식을 비교해보면 delta 변수와 TD-error가 같은 것을 확인 할 수 있습니다.

      er<-target_Q-qvalue

      delta<-re_ep[1]+dis_f*er[action_index]   

numpy의 shape

0

580

1

tfjs-node 안깔려서

0

1097

1

ADP 자격증 대비 강의 개설 문의

0

809

2

하이퍼 파라미터 튜닝 범위

0

605

1

딥러닝 코드에 Batch Normalization 적용해보기 질문입니다

0

576

1

flyctl 관련 재문의 드립니다.

0

591

1

mac os ) zip 파일 dataframe 오류

0

659

1

flyctl 배포 관련 에러 문의드립니다.

0

749

1

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 질문입니다

0

475

1

numpy.random.default_rng/hyperopt버젼

0

1166

1

Binary Classfication 딥러닝 적용해보기 질문입니다

0

363

1

업로드 후 홈화면에서 이미지가 보이지 않습니다

0

581

1

n_iter 횟수 넘음 질문

0

485

2

image 파일에서 vscode로 드래그 앤 드롭을 처리할 수 없다고 합니다

0

1009

1

upload 페이지에 아무것도 안 뜨는 현상

0

433

1

혹시 응용편은 어디서 볼 수 있을까요?

0

470

1

[질문] 파이썬 머신러닝 완벽 가이드 교차검증-2 강의내용

1

446

1

다차원 데이터 군집화와 시각화에 대해 질문드립니다

0

551

1

강의 자료 부탁드립니다 !

0

405

1

postman invalid url 질문드립니다.

0

1011

1

hyperopt를 이용한 하이퍼파라미터 튜닝

0

615

1

강화학습 예시로 날씨예측

0

438

1

return_reward 함수에서

0

243

3

강의자료와 코드에 아무것도 안뜹니다.

0

205

1