강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

능함가님의 프로필 이미지
능함가

작성한 질문수

강화학습 입문에서 Deep Q-learning/Policy Gradient까지

결정론적 vs. 확률론적 환경(Deterministic vs. Stochastic Environment)

전이확률 / stochastic env.

작성

·

20

0

안녕하세요.

그럼 stochastic env. 에서
특정 action을 선택해서 행했을때, 그 action이 이루어 지는지 다른 action이 이루어 지는지에 대한 확률이 transition probability(전이확률) 이 되는 것이라는 말씀인지요?

 

감사합니다.

답변 1

0

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

아닙니다.

  • stochastic env.에서 선택한 action 자체는 그대로 실행됩니다.

  • 다만 그 결과(다음 상태·보상)가 확률적으로 달라지며, 이것이 transition probability입니다.

좋은 질문 감사합니다.

능함가님의 프로필 이미지
능함가

작성한 질문수

질문하기