강의

멘토링

커뮤니티

Inflearn Community Q&A

etank34721's profile image
etank34721

asked

From Introduction to Reinforcement Learning to Deep Q-learning/Policy Gradient

Deterministic vs. Stochastic Environment

전이확률 / stochastic env.

Written on

·

52

0

안녕하세요.

그럼 stochastic env. 에서
특정 action을 선택해서 행했을때, 그 action이 이루어 지는지 다른 action이 이루어 지는지에 대한 확률이 transition probability(전이확률) 이 되는 것이라는 말씀인지요?

 

감사합니다.

python딥러닝강화학습pytorch

Answer 1

0

YoungJea Oh님의 프로필 이미지
YoungJea Oh
Instructor

아닙니다.

  • stochastic env.에서 선택한 action 자체는 그대로 실행됩니다.

  • 다만 그 결과(다음 상태·보상)가 확률적으로 달라지며, 이것이 transition probability입니다.

좋은 질문 감사합니다.

etank34721's profile image
etank34721

asked

Ask a question