inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) (업데이트)

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 질문

508

허쿡

작성한 질문수 51

0

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 강의

12분 19초

 

해당 부분에서 SVC(random_state = 1) 와 같이

random_state 를 지정해주는 부분이 있는데요.

 

기존에 제가 가지고 있던 생각은  SVC 모델의 경우

학습데이터에서 랜덤하게 샘플링해서 학습하는 게 아니라

학습데이터를 통째로 활용하는줄 알았거든요..

 

혹시 SVC 모델이 decision boundary 를 결정할 때

학습데이터를 통으로 사용하는 것이 아니라

bootstrap 방식처럼 전체 학습데이터에서

랜덤하게  샘플링한 데이터를 활용하기에

random_state 옵션이 따로 있는 것인가요?

 

답변 부탁드립니다. 감사합니다. :)

python 머신러닝 배워볼래요? pandas kaggle

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 답변도우미입니다.

 

다음 공식 가이드에서 처럼 random_state 가 있는데요. 각 머신러닝 메서드에서는 키컨셉 이외에도 내부적으로 구현시 필요한 다양한 랜덤 파라미터들이 있다고 보시면 좋을 것 같습니다. 그래서, 이 랜덤으로 지정해야 하는 내부 값을 고정하기 위해, 대부분의 sklearn 의 머신러닝 기법들이 random_state 를 제공하고 있습니다.

https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

 

감사합니다.

0

허쿡

구현시 필요한 다양한 랜덤 파라미터들이 있다고 하셨는데

구체적으로 예시 1~2 가지만 들어주실 수 있을까요?

답변 감사합니다.

0

잔재미코딩 DaveLee

안녕하세요. 답변도우미입니다. 

각 함수가 실제 내부에 어떻게 구현이 되어있는지까지는 알기가 매우 어려운 부분은 충분히 이해하고 계실 것 같습니다. 다음과 같이 SVC 에서 다음 구현에 해당하는 부분은 random number 를 사용하고 있음은 공식적으로 sklearn 에서 이야기를 하고 있어서, 이 부분도 예시가 될 수 있을 것 같습니다.

감사합니다.

https://scikit-learn.org/stable/modules/svm.html

Randomness of the underlying implementations: The underlying implementations of SVC and NuSVC use a random number generator only to shuffle the data for probability estimation (when probability is set to True). This randomness can be controlled with the random_state parameter. If probability is set to False these estimators are not random and random_state has no effect on the results. The underlying OneClassSVM implementation is similar to the ones of SVC and NuSVC. As no probability estimation is provided for OneClassSVM, it is not random.

0

허쿡

답변 감사합니다 :)

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

97

1

고차원 데이터 질문

0

85

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

217

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

235

1

sklearn v1.5.1

0

176

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

185

2

missingno 대체

0

174

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

136

1

환불문의

0

273

1

자료공유를 받으려고 하는데 에러가 납니다.

0

170

1

iplot에서 항상 에러나는 분 안계신가용?

0

234

1

사망 여부 영향 가능성

0

149

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

195

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

288

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

252

1

3강 강의 자료 코드 관련 질문입니다

1

344

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

427

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

887

2

Bayesian Optimization LightGBM 적용

0

467

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

218

1

강의 중 에러 질문

0

753

1

cross_val_score 에러

0

470

1