강의

멘토링

로드맵

Inflearn Community Q&A

diane339627's profile image
diane339627

asked

Learning Artificial Intelligence by Making (Reinforcement Learning)

Reinforcement learning methods

alpha가 학습속도를 조절하는 상수라고 하셨는데

Written on

·

320

0

그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?

999999이런 식으로 하면 좋은 것인가요??

숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요? 

만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요? 

아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요? 

만약 패널티가 생긴다면 어떤 패널티가 생길까요>??

감사합니다.

강화학습

Quiz

강화 학습에서 '환경'을 설명할 때 강조되는 주요 특징은 무엇일까요?

실제 세계를 정밀하게 복제한다.

핵심 요소를 선별하고 변수를 추상화한다.

오직 에이전트의 행동에 의해서만 변화한다.

미래 상태가 과거 모든 상태에 의존적이다.

Answer 2

0

diane339627님의 프로필 이미지
diane339627
Questioner

감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??

감사합니다! 

0

kwangsung님의 프로필 이미지
kwangsung
Instructor

결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.

알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.

감사합니다.

diane339627's profile image
diane339627

asked

Ask a question