• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

하이퍼파라미터 이해

21.03.25 10:59 작성 조회수 200

0

매번 좋은 강의 감사합니다 선생님.

하이퍼파라미터를 쓰는 이유는 알겠습니다. 하지만 언제 어떻게 어떤 하이퍼파라미터 써야하는지, 또 무엇을 의미하는지 완벽하게 이해가 안가서 질문드립니다. 너무 기초적인 질문이라서 죄송합니다 ㅠㅠㅠ

답변 1

답변을 작성해보세요.

1

안녕하십니까,

일단 질문내용을 자세히 이해 못했습니다.

1. 언제 어떻게 어떤 하이퍼파라미터 써야하는지

=> 언제라는 의미를 잘 모르겠습니다만, 하이퍼 파라미터는 모델 성능을 극대화 시키려고 사용합니다.

어떻게, 어떤 하이퍼 파라미터가 모델 성능을 극대화 시키는지는 여러가지 상황에 따라, 예를 들어, 데이터의 특성에 따라 달라집니다.

그래서 GridSearchCV 같은 유틸리티로 일정한 하이퍼 파라미터 값을 여러개 세팅해서 모델을 학습/평가하여 최적 하이퍼 파라미터를 도출합니다.

모르셔도 모델을 만드시는데, 문제가 없습니다(Default 값으로 하면 됩니다). 아시면 모델 성능을 더 낼 수 있습니다.

2. 무엇을 의미하는지는, 트리기반이냐, 선형 기반이냐등의 머신러닝 알고리즘에 따라 여러가지 유형이 있습니다.  트리의 구조 생성을 어떻게 제어할 것인가? 오버 피팅을 막기위한 Regularization을 제어하는 등의 다양한 하이퍼 파라미터가 있습니다. 4장과 5장은 이들 하이퍼 파라미터들에 대한 상세한 설명이 있으니, 참조하시면 좋을 것 같습니다.

감사합니다.