• 카테고리

    질문 & 답변
  • 세부 분야

    게임 프로그래밍

  • 해결 여부

    미해결

PPO 알고리즘을 ml-agents learn 명령어로 학습 및 추론할때 메소드 호출 순서 질문

24.01.23 22:53 작성 24.01.23 22:54 수정 조회수 125

0

안녕하세요!

먼저 기초편에 이어서 응용편 강의를 공개해주셔서 정말 감사합니다!!

 

해당 강의를 들으면서 PPO 알고리즘을 ml-agents learn 명령어로 학습 할 때와 추론할 때 메소드 호출 순서에 대해서 궁금합니다.

이 내용이 궁금한 이유는 각 학습 또는 추론 과정에서 각 메소드별로 연산 시간을 측정하기 위해서 입니다.

 

관련 자료를 어디서 확인할 수 있을까요?

 

감사합니다!

답변 1

답변을 작성해보세요.

0

안녕하세요!

메소드 호출 순서에 대해서는 저도 직접 확인해보지는 못했습니다! ㅜㅜ

mlagents-learn PPO 관련 코드는 github에서는 다음의 내용과 관련된 것으로 알고 있습니다!

https://github.com/Unity-Technologies/ml-agents/blob/develop/ml-agents/mlagents/trainers/ppo/trainer.py