MA-POCA 알고리즘 응용 질문
11
1 asked
EscapeRoom 환경에서 MA-POCA 쓸 때 actor는 에이전트가 개별적으로 사용하는 것으로 설계가 되어 있는데요. 유니티 상에서 에이전트들은 셋이 다 똑같이 생겨서 구분이 안되어 있는데, 매 에피소드마다 파이썬에서 부여되는 에이전트 id는 유니티 상에서 만들어둔 에이전트와 항상 같은 object로 매칭되는 것인지 궁금합니다. 코드를 응용해보려고 하는데 엑터 셋의 역할고정이 가능할지 궁금해서요!
또 한 에피소드에서 어떤 에이전트는 trap에 빠지고 어떤 에이전트는 살아남은 상태에서 에피소드가 종료될텐데.. 그럼 그 다음 에피소드에서는 그것과 관계없이 언제나 에이전트 셋 다 리셋되는 건지, trap에 빠진 에이전트만 리셋되는 건지도 궁금합니다.
Answer 1
1
안녕하세요!!
EscapeRoom 코드에서는 Unity 씬에 배치된 각 Agent 오브젝트가 계속 재사용되므로, id는 같은 object에 매칭되었던 것으로 기억합니다! 단, 엑터가 역할이 고정되면 모든 에이전트가 동일 목표를 수행한다기 보다는 각각 다른 역할이 생기면서 보상 설정이나 멀티 에이전트 설정 등에서 다른 방식을 사용해야 할 것으로 생각합니다!
그리고 질문주신 2번째 내용을 설명드리자면 우선적으로 trap에 빠진 Agent는 그 즉시 전체 리셋되는 게 아니라 해당 Agent만 비활성화됩니다.
이후 episode가 끝나면 AgentList 전체가 다시 활성화되고, 위치/속도도 모두 초기화됩니다. 즉 다음 에피소드에서는 trap 여부와 관계없이 항상 세 Agent가 모두 리셋됩니다.
5강, 오류 수정과 관련해서
0
8
2
컴퓨터를 껐다가 클로드 코드 다시 키는 방법 알려주세요.
0
13
1
Pivot을 마우스로 클릭하고 드래그해도 움직이 않아서 혹시 아시는 부분이 있나 해서 문의 남깁니다.
0
15
1
카메라가 많아지면 렌더링 비용이 커지나요?
0
28
1
3:56에 폰트 불러온 과정이 궁금합니다 ㅠㅠ
0
40
3
Spider와 Monster 구현 방식을 구분한 이유
1
25
1
Sprute Sheet에 대해서.
0
35
1
ResourceManager 클래스 관련 질문
1
43
2
FBX chan 모델
0
28
1
첨부된 수업자료와 강의 내용이 다릅니다.
0
68
2
몬스터 HP 게이지바 이동
0
24
1
TextMeshPro용 커스텀 한글 2350자.txt 파일은 어디에 있나요?
0
34
1
02-02 NavMesh 응용 캐릭터 멈춤 문제
0
36
1
02-02 NavMesh 응용 캐릭터 멈춤 문제
0
50
2
C#에서의 RAII
0
74
3
Scene 뷰에서 Enemy Entity가 보이지 않는 문제
0
51
2
Lessons 3 & 4 don't have subtitles unfortunately
0
40
1
aws deep racer 이제 못하는건가요?
0
52
2
클로드코드 + 유니티 컨텐츠만들기 응용에 대하여 질문드립니다.
0
83
1
매니저 관련 질문이 있습니다.
0
76
2
닷지 ckpt 모델 파일을 onnx변환 후 unity에서 추론
0
172
2
(PPO 실습 2) total_loss 구하는 코드에서 action entropy 는 어떻게 계산된 것인지 궁금합니다.
0
356
1
예제 파일 실행 오류
0
304
1
PPO 알고리즘을 ml-agents learn 명령어로 학습 및 추론할때 메소드 호출 순서 질문
0
374
1

