강의 잘 봤습니다.
261
작성한 질문수 6
강의 너무 잘 보고 다음 강의도 너무 기대하고 있습니다.
대부분 에이전트를 제어해서 잘한 행동에 점수를 줘서 학습하는 방식을 배웠는데요
강화학습으로
레이싱게임에 사용될 다양한 레이싱 트랙을 만는다던지.
3매칭 퍼즐게임에 사용되는 다양한 퍼즐판을 만든다던지
슈퍼마리오의 다양한 스테이지 구성한다던지..
이런걸 할려면 어떤 알고리즘을 사용해야 되나요?
만약 이미 사람이 만든 수천개의 레이싱 트랙이나 퍼즐판이 있다면 모방학습으로 가능할까요?
전혀 어떻게 해야 할지 모르겠습니다.ㅜㅜ
어떻게 해야 할지 가이드를 살짝 해주시면 감사하겠습니다.
알고리즘 이름이라던지.. 관련자료 url 등등 부탁 드립니다.
답변 1
0
안녕하세요!
강의 잘 봐주셨다니 정말 감사드립니다! :)
말씀주신 부분의 경우 Environment design 관련 내용인 것으로 생각되네요!
최근에 구글에서 Unsupervised Environment Design (UED) 관련하여 연구한 논문이 있어서 제가 몇편 리뷰하고 노션에 정리했었는데 해당 내용 공유드리겠습니다! 도움이 되면 좋겠네요!
PAIRED: A New Multi-Agent Approach for Adversarial Environment Generation
CLUTR: Curriculum Learning via Unsupervised Task Representation Learning
설치 프로그램 버전 질문있습니다.
0
74
2
env 환경경로 입력방법
0
78
2
onnx에 대해서
0
110
1
텐서플로우가 안열립니다
0
101
2
DQN을 위한 파라메터값 세팅에서 goal-plus, goal-ex
0
79
1
dqn 인덱스 에러
0
92
3
2025년 pip ml agents 설치 에러
0
215
1
DQN 실행 오류
0
307
2
ML-Agents 살펴보기 11페이지 질문입니다.
0
210
1
배웠던 내용을 기반으로 match3 인공지능으로 플레이 하는 걸 만들고 있는데.. 질문이 있습니다.
0
378
2
3DBall 학습 중 문제
0
218
1
mlagents-learn --hlep
0
236
1
DQN 환경 학습
0
366
3
DQN 함수를 어디에다 만들고 실행하나요??>?>
0
335
1
갑자기 Template>Scripts 폴더는 어디에서 만들어졌는지...
0
279
2
mlagents-learn 에러 수정 방법을 문의드립니다.
0
643
3
Pyuthon API 적용
0
701
7
GridWorld, CollectObservations에서 에러 질문입니다.
0
641
1
yaml을 이용한 GAIL 및 BC를 mlagents-learn으로 실행 시 에러
0
456
1
GridWorld, 유니티에서 실행하면 observation 관련 에러가 뜹니다.
0
489
2
PPO Parameters에서 normalize 관련 질문입니다.
0
356
1
GridWorld 가 작동은 잘 되는데, score가 너무 낮게 나와요.
0
568
3
GridWorld가 움직이지 않고, time out 으로 중지됩니다.
0
483
2
싱글에이전트 코드를 멀티에이전트 코드로 수정 관련
0
408
2





