inflearn logo
강의

Course

Instructor

Complete Guide to Unity Machine Learning Agents (Basics)

모방학습과 강화학습의 조합?

804

hjk1000

3 asked

1

안녕하세요
강의를 잘 듣고 열심히 공부중입니다.
강화학습 모방학습을 합치는 방법이 있을까요?
DQfD라는 논문이 있던데
아직 수식을 정확히 이해를 못해서..ㅠㅠ
에이전트가 쌓은 에피소드 데이터들 말고
사람(전문가)가 직접 플레이한 데이터를 이용하여 정책함수를 학습시키고나서 (사전 학습)
강화학습을 하면 더 빨리 학습할 수 있을까요?

unity-ml-agents 강화학습 unity 머신러닝 배워볼래요?

Answer 2

1

kyushik

안녕하세요! 강의 수강해주셔서 감사합니다! :) 

사람의 플레이를 기반으로 정책함수를 사전학습하고 강화학습을 수행하는 방법은 알파고나 알파스타에서 사용한 기법입니다. 이를 기반으로 봤을 때 사람이 먼저 정책의 틀을 잡고 그 상태에서 강화학습 에이전트를 학습을 통해 성능을 강화하는 내용의 학습 방법도 종종 사용되는 것으로 생각됩니다. 본 강의 9장에서 다루는 내용과 머신러닝 에이전트에서 정리한 내용을 살펴봤을때에는 강화학습과 모방학습을 조합하여 학습할 때 더 학습이 빠르게 진행되는 것을 확인할 수 있습니다! 

1

rlforus

넵! 실제로 본 강의 섹션 9 - Behavioral Cloning 를 참조하시면 말씀하신 부분에 대한 내용을 다루게 됩니다.

설치 프로그램 버전 질문있습니다.

0

74

2

env 환경경로 입력방법

0

78

2

onnx에 대해서

0

110

1

텐서플로우가 안열립니다

0

101

2

DQN을 위한 파라메터값 세팅에서 goal-plus, goal-ex

0

79

1

dqn 인덱스 에러

0

92

3

2025년 pip ml agents 설치 에러

0

215

1

DQN 실행 오류

0

307

2

ML-Agents 살펴보기 11페이지 질문입니다.

0

210

1

배웠던 내용을 기반으로 match3 인공지능으로 플레이 하는 걸 만들고 있는데.. 질문이 있습니다.

0

378

2

3DBall 학습 중 문제

0

218

1

mlagents-learn --hlep

0

236

1

DQN 환경 학습

0

366

3

DQN 함수를 어디에다 만들고 실행하나요??>?>

0

335

1

갑자기 Template>Scripts 폴더는 어디에서 만들어졌는지...

0

280

2

mlagents-learn 에러 수정 방법을 문의드립니다.

0

643

3

Pyuthon API 적용

0

701

7

GridWorld, CollectObservations에서 에러 질문입니다.

0

641

1

yaml을 이용한 GAIL 및 BC를 mlagents-learn으로 실행 시 에러

0

456

1

GridWorld, 유니티에서 실행하면 observation 관련 에러가 뜹니다.

0

489

2

PPO Parameters에서 normalize 관련 질문입니다.

0

356

1

GridWorld 가 작동은 잘 되는데, score가 너무 낮게 나와요.

0

568

3

GridWorld가 움직이지 않고, time out 으로 중지됩니다.

0

483

2

싱글에이전트 코드를 멀티에이전트 코드로 수정 관련

0

408

2