inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Học trí tuệ nhân tạo trong khi tạo ra nó (học tăng cường)

Phương pháp học tăng cường

alpha가 학습속도를 조절하는 상수라고 하셨는데

325

diane339627

2 câu hỏi đã được viết

0

그렇다면 최대한 큰 숫자를 설정해야 좋은 것인가요?

999999이런 식으로 하면 좋은 것인가요??

숫자가 크면 클수록 무제한으로 학습속도가 빨라지나요? 

만약 그렇게 빨라진다면 왜 사람들은 가장 큰 수르 넣지 않는 것인가요? 

아니면 일정이상 커지면 어떠한 패널티가 생기기에 적당한 수가 적절한가요? 

만약 패널티가 생긴다면 어떤 패널티가 생길까요>??

감사합니다.

강화학습

Câu trả lời 2

0

diane339627

감사합니다! 해를 찾지 못한다는게 무슨 소리인가요? 리워드를 적절히 받을 수 없다는 것인가요??

감사합니다! 

0

kwangsung

결론은 빨라지는건 좋은데 너무 빨라지면 해를 찾는데 진동하면서 해를 찾지 못하게 됩니다. 보통 알파값은 0~1 사이값을 설정합니다.

알파값에 대한 더 자세한 내용은 제가 이번에 출시한 "반드시 알아야 할 Tensorflow 수학"에 나와있습니다. 2주간 할인을 하고 있으니 등록하시고 내용을 보시면 좋겠습니다.

감사합니다.

혹시 응용편은 어디서 볼 수 있을까요?

0

471

1

karting asset

0

434

2

using Unity.MLAgents; 오류

0

641

1

mlagents-learn --help

0

825

1

오류

0

842

1

CPU로 학습해도 충분할까요?

0

1459

1

경로 생성

0

454

2

학습 관련

0

256

1

알고리즘 관련

1

323

1

API를 통한 학습 관련

1

552

1

ml-agents 관련 질문 있습니다.

1

468

1

tf.placeholder 에러

0

528

1

DQN 학습 및 저장 모델 불러오기 속도 문의

1

441

1

안녕하세요!

0

341

1

cartpole_reinforce.ipynb 에러

0

530

2

DQN 알고리즘 실행 결과

0

357

1

슬라이드 링크

0

550

1

완성된 프로젝트 관련하여 질문 있습니다.

1

436

1

DQN 코드 에러

0

494

1

DQN 질문

0

546

1

개발환경 구축관련 문의 드립니다.

0

230

1

MDP질문

0

207

1

MDP 질문

0

266

1

인프런에서 결제를 했는데

0

258

2