강의

멘토링

커뮤니티

Inflearn コミュニティ Q&A

diane339627 のプロフィール画像
diane339627

投稿した質問数

作りながら学ぶ人工知能(強化学習編)

強化学習方法

alpha가 학습속도를 조절하는 상수라고 하셨는데

作成

·

317

0

그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?

999999이런 식으로 하면 좋은 것인가요??

숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요? 

만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요? 

아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요? 

만약 패널티가 생긴다면 어떤 패널티가 생길까요>??

감사합니다.

강화학습

回答 2

0

diane339627님의 프로필 이미지
diane339627
質問者

감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??

감사합니다! 

0

kwangsung님의 프로필 이미지
kwangsung
インストラクター

결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.

알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.

감사합니다.

diane339627 のプロフィール画像
diane339627

投稿した質問数

質問する