인프런 커뮤니티 질문&답변
DQN을 위한 파라메터값 세팅에서 goal-plus, goal-ex
작성
·
75
0
state_size에서
[3, 64,84]면은
아 알쥐비하고 해상도를 이용해 스테이트사이즈를 세팅했구나를 알겠는데
goal-plus
하고
goal-ex
하고
나뉘어져 있는 이유를 모르겠습니다.
각각
goal-plus
goal-ex
는 어떤 의미의 집합인가요?
퀴즈
51%나 틀려요. 한번 도전해보세요!
DQN의 가장 핵심적인 아이디어는 무엇일까요?
보상 함수를 직접 학습한다.
신경망으로 Q-값을 근사한다.
정책 함수를 직접 학습한다.
환경 모델을 구축하여 예측한다.
답변 1
0
이현호
지식공유자
안녕하세요!
그리드월드 환경에서 goal은 plus 또는 ex가 번갈아 가면서 나오는데요. 해당 정보를 이미지 정보로 녹이기 위해서 각 골에 대한 채널을 각각 만들어주었는데요. 골에 따라 활성화/비활성화에 따라 상태 차이를 만들어 에이전트가 알 수 있도록 하기 위함입니다.
추가로 궁금한게 있다면 말씀해주세요 :)





