inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

만들면서 배우는 인공지능(강화학습 편)

강화학습 방법

alpha가 학습속도를 조절하는 상수라고 하셨는데

325

이효빈

작성한 질문수 2

0

그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?

999999이런 식으로 하면 좋은 것인가요??

숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요? 

만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요? 

아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요? 

만약 패널티가 생긴다면 어떤 패널티가 생길까요>??

감사합니다.

강화학습

답변 2

0

이효빈

감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??

감사합니다! 

0

최광성

결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.

알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.

감사합니다.

혹시 응용편은 어디서 볼 수 있을까요?

0

471

1

karting asset

0

434

2

using Unity.MLAgents; 오류

0

641

1

mlagents-learn --help

0

825

1

오류

0

842

1

CPU로 학습해도 충분할까요?

0

1459

1

경로 생성

0

454

2

학습 관련

0

256

1

알고리즘 관련

1

323

1

API를 통한 학습 관련

1

552

1

ml-agents 관련 질문 있습니다.

1

468

1

tf.placeholder 에러

0

528

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

441

1

안녕하세요!

0

341

1

cartpole_reinforce.ipynb 에러

0

530

2

DQN 알고리즘 실행 결과

0

357

1

슬라이드 링크

0

550

1

완성된 프로젝트 관련하여 질문 있습니다.

1

436

1

DQN 코드 에러

0

494

1

DQN 질문

0

546

1

개발환경 구축관련 문의 드립니다.

0

230

1

MDP질문

0

207

1

MDP 질문

0

266

1

인프런에서 결제를 했는데

0

258

2