질문 & 답변 - 인프런 | 커뮤니티

질문 게시판

고민있어요

스터디

팀 프로젝트

멘토링

멘토링 후기

수강평

With us

인프런 피드

블로그

인프런 소개

공지사항

대시보드

강의

홈

로드맵

더보기

묻고 답해요

130만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

미해결
프로그래머를 위한 강화학습(저자 직강)

DQN 알고리즘 실행 결과

말씀하신대로 코드를 수정하니 정상적으로 학습을 진행합니다.다만 학습 결과가 안 좋은데.... 강의에서 설명하신 것을 보면 하이퍼 파라메터에 민감하다고 하셨습니다.제 생각에는 하이퍼 파라메타 문제보다 타겟 신경망을 계속 업데이트하는 문제, 즉 부트스트랩의 문제점이라고 생각합니다. 유튜브나 다른 책에서 DQN 코드를 보면 별도의 타겟 신경망을 만들어서 따로 업데이트하고 있습니다.현재 코드는 부트스트랩 문제를 안고 있는데, 학습 결과가 좋지 않은 것에 대해 의견 부탁드립니다.

ljp4122 · 2022.12.14 · 프로그래머를 위한 강화학습(저자 직강)

투표점수

0

조회수

229

답변

1

인기 태그

주간 인기글