inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

gridsearchcv

310

예찬

작성한 질문수 30

0

gridsearchcv를 이용하여 최적의 하이퍼 파라미터를 찾을 때 DecisionTreeClassifier( random_state=11 )이런식으로 난수 발생값을 고정해 놓지 않으면 최적의 하이퍼 파라미터가 계속 달러지던데, 최적의 하이퍼 파라미터를 찾을 땐 난수 발생값을 고정시키고 찾아야 하는건가요? 그렇다면 난수 발생값 설정은 뭘 보고 어떤 기준으로 설정해줘야 하는건가요

머신러닝 배워볼래요? python 통계

답변 1

1

권 철민

안녕하십니까, 

일반적으로 random_state를 정하지 않아도 GridSearchCV에서 최적 하이퍼 파라미터가 수행시마다 다르지 않습니다. 

다만 붓꽃데이터와 같이 데이터 세트가 너무 작으면 Cross validation으로 나누어지는 데이터 세트가 너무 작기 때문에 어떻게 데이터가 나누어지는지에 따라 조금씩 최적 값이 달라질 수 있습니다. 

 

0

예찬

비교적 큰 데이터셋인데 gridsearchcv에서 최적 하이퍼 파라미터가 수행할 때 마다 변한다면 어떤게 문제라고 고려할 수 있을까요?

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

56

2

안녕하세요 열심히 수강중인 학생입니다

0

93

2

정수 인덱싱

0

86

2

넘파이 오류

0

115

2

11강 numpy의 axis 축 질문 드립니다.

0

109

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

97

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

81

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

79

3

파이썬 다운그레이 후 사이킷런 재설치

0

131

2

좋은 강의 감사합니다.

0

82

2

scoring 함수 음수값

0

75

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

90

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

119

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

195

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

156

2

실루엣 스코어..

0

93

2