PPO 알고리즘을 ml-agents learn 명령어로 학습 및 추론할때 메소드 호출 순서 질문

Question

안녕하세요!먼저 기초편에 이어서 응용편 강의를 공개해주셔서 정말 감사합니다!!해당 강의를 들으면서 PPO 알고리즘을 ml-agents learn 명령어로 학습 할 때와 추론할 때 메소드 호출 순서에 대해서 궁금합니다.이 내용이 궁금한 이유는 각 학습 또는 추론 과정에서 각 메소드별로 연산 시간을 측정하기 위해서 입니다.관련 자료를 어디서 확인할 수 있을까요?감사합니다!

Answer

안녕하세요!

메소드 호출 순서에 대해서는 저도 직접 확인해보지는 못했습니다! ㅜㅜ

mlagents-learn PPO 관련 코드는 github에서는 다음의 내용과 관련된 것으로 알고 있습니다!

https://github.com/Unity-Technologies/ml-agents/blob/develop/ml-agents/mlagents/trainers/ppo/trainer.py

yji112

PPO 알고리즘을 ml-agents learn 명령어로 학습 및 추론할때 메소드 호출 순서 질문

이 글과 비슷한 Q&A

DQN 함수를 어디에다 만들고 실행하나요??>?>

6주차 질문입니다.

플레이어 캐릭터에 Renderer를 추가하는 이유가 있을까요?

갑자기 Template>Scripts 폴더는 어디에서 만들어졌는지...