작성한 질문수
강화학습 입문에서 Deep Q-learning/Policy Gradient까지
결정론적 vs. 확률론적 환경(Deterministic vs. Stochastic Environment)
작성
·
20
0
안녕하세요.
그럼 stochastic env. 에서특정 action을 선택해서 행했을때, 그 action이 이루어 지는지 다른 action이 이루어 지는지에 대한 확률이 transition probability(전이확률) 이 되는 것이라는 말씀인지요?
감사합니다.
답변 1
아닙니다.
stochastic env.에서 선택한 action 자체는 그대로 실행됩니다.
다만 그 결과(다음 상태·보상)가 확률적으로 달라지며, 이것이 transition probability입니다.
좋은 질문 감사합니다.