강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

미야옹님의 프로필 이미지
미야옹

작성한 질문수

유니티 머신러닝 에이전트 완전정복 (기초편)

DQN 실습 1

DQN을 위한 파라메터값 세팅에서 goal-plus, goal-ex

작성

·

75

0

state_size에서
[3, 64,84]면은
아 알쥐비하고 해상도를 이용해 스테이트사이즈를 세팅했구나를 알겠는데

goal-plus

하고

goal-ex

하고

나뉘어져 있는 이유를 모르겠습니다.


각각
goal-plus

goal-ex

는 어떤 의미의 집합인가요?

퀴즈

51%나 틀려요. 한번 도전해보세요!

DQN의 가장 핵심적인 아이디어는 무엇일까요?

보상 함수를 직접 학습한다.

신경망으로 Q-값을 근사한다.

정책 함수를 직접 학습한다.

환경 모델을 구축하여 예측한다.

답변 1

0

이현호님의 프로필 이미지
이현호
지식공유자

안녕하세요!

 

그리드월드 환경에서 goal은 plus 또는 ex가 번갈아 가면서 나오는데요. 해당 정보를 이미지 정보로 녹이기 위해서 각 골에 대한 채널을 각각 만들어주었는데요. 골에 따라 활성화/비활성화에 따라 상태 차이를 만들어 에이전트가 알 수 있도록 하기 위함입니다.

 

추가로 궁금한게 있다면 말씀해주세요 :)

미야옹님의 프로필 이미지
미야옹

작성한 질문수

질문하기