인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

예찬님의 프로필 이미지
예찬

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

gridsearchcv

작성

·

297

0

gridsearchcv를 이용하여 최적의 하이퍼 파라미터를 찾을 때 DecisionTreeClassifier( random_state=11 )이런식으로 난수 발생값을 고정해 놓지 않으면 최적의 하이퍼 파라미터가 계속 달러지던데, 최적의 하이퍼 파라미터를 찾을 땐 난수 발생값을 고정시키고 찾아야 하는건가요? 그렇다면 난수 발생값 설정은 뭘 보고 어떤 기준으로 설정해줘야 하는건가요

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

일반적으로 random_state를 정하지 않아도 GridSearchCV에서 최적 하이퍼 파라미터가 수행시마다 다르지 않습니다. 

다만 붓꽃데이터와 같이 데이터 세트가 너무 작으면 Cross validation으로 나누어지는 데이터 세트가 너무 작기 때문에 어떻게 데이터가 나누어지는지에 따라 조금씩 최적 값이 달라질 수 있습니다. 

 

예찬님의 프로필 이미지
예찬
질문자

비교적 큰 데이터셋인데 gridsearchcv에서 최적 하이퍼 파라미터가 수행할 때 마다 변한다면 어떤게 문제라고 고려할 수 있을까요?

예찬님의 프로필 이미지
예찬

작성한 질문수

질문하기