인프런 커뮤니티 질문&답변
gridsearchcv
작성
·
301
0
gridsearchcv를 이용하여 최적의 하이퍼 파라미터를 찾을 때 DecisionTreeClassifier( random_state=11 )이런식으로 난수 발생값을 고정해 놓지 않으면 최적의 하이퍼 파라미터가 계속 달러지던데, 최적의 하이퍼 파라미터를 찾을 땐 난수 발생값을 고정시키고 찾아야 하는건가요? 그렇다면 난수 발생값 설정은 뭘 보고 어떤 기준으로 설정해줘야 하는건가요
답변 1
1
권 철민
지식공유자
안녕하십니까,
일반적으로 random_state를 정하지 않아도 GridSearchCV에서 최적 하이퍼 파라미터가 수행시마다 다르지 않습니다.
다만 붓꽃데이터와 같이 데이터 세트가 너무 작으면 Cross validation으로 나누어지는 데이터 세트가 너무 작기 때문에 어떻게 데이터가 나누어지는지에 따라 조금씩 최적 값이 달라질 수 있습니다.






비교적 큰 데이터셋인데 gridsearchcv에서 최적 하이퍼 파라미터가 수행할 때 마다 변한다면 어떤게 문제라고 고려할 수 있을까요?