[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) (업데이트)

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 질문

2022-08-01T08:28:48.923Z

508

허쿡

작성한 질문수 51

하이퍼 파라미터 튜닝 기법 적용하기 (SVC 실습) 강의
12분 19초
 
해당 부분에서 SVC(random_state = 1) 와 같이
random_state 를 지정해주는 부분이 있는데요.
 
기존에 제가 가지고 있던 생각은  SVC 모델의 경우
학습데이터에서 랜덤하게 샘플링해서 학습하는 게 아니라
학습데이터를 통째로 활용하는줄 알았거든요..
 
혹시 SVC 모델이 decision boundary 를 결정할 때
학습데이터를 통으로 사용하는 것이 아니라
bootstrap 방식처럼 전체 학습데이터에서
랜덤하게  샘플링한 데이터를 활용하기에
random_state 옵션이 따로 있는 것인가요?
 
답변 부탁드립니다. 감사합니다. :)

python 머신러닝 배워볼래요? pandas kaggle

답변 1

잔재미코딩 DaveLee

2022-08-02T09:17:14.261Z

안녕하세요. 답변도우미입니다.

다음 공식 가이드에서 처럼 random_state 가 있는데요. 각 머신러닝 메서드에서는 키컨셉 이외에도 내부적으로 구현시 필요한 다양한 랜덤 파라미터들이 있다고 보시면 좋을 것 같습니다. 그래서, 이 랜덤으로 지정해야 하는 내부 값을 고정하기 위해, 대부분의 sklearn 의 머신러닝 기법들이 random_state 를 제공하고 있습니다.

https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

감사합니다.

허쿡

2022-08-02T10:50:23.634Z

구현시 필요한 다양한 랜덤 파라미터들이 있다고 하셨는데

구체적으로 예시 1~2 가지만 들어주실 수 있을까요?

답변 감사합니다.

잔재미코딩 DaveLee

2022-08-10T08:03:35.778Z

안녕하세요. 답변도우미입니다.

각 함수가 실제 내부에 어떻게 구현이 되어있는지까지는 알기가 매우 어려운 부분은 충분히 이해하고 계실 것 같습니다. 다음과 같이 SVC 에서 다음 구현에 해당하는 부분은 random number 를 사용하고 있음은 공식적으로 sklearn 에서 이야기를 하고 있어서, 이 부분도 예시가 될 수 있을 것 같습니다.

감사합니다.

https://scikit-learn.org/stable/modules/svm.html

Randomness of the underlying implementations: The underlying implementations of SVC and NuSVC use a random number generator only to shuffle the data for probability estimation (when probability is set to True). This randomness can be controlled with the random_state parameter. If probability is set to False these estimators are not random and random_state has no effect on the results. The underlying OneClassSVM implementation is similar to the ones of SVC and NuSVC. As no probability estimation is provided for OneClassSVM, it is not random.

허쿡

2022-08-11T01:33:12.941Z

답변 감사합니다 :)

자료 공유 질문

2026-01-26T15:25:01.339Z

Ascii 에러 관련하여 질문드립니다

2025-11-25T07:02:00.560Z

고차원 데이터 질문

2025-11-25T04:02:15.844Z

세션4 범주형 데이터 분석 패턴 강의 질문

2025-02-21T05:28:01.806Z

217

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

2025-02-06T05:04:06.743Z

235

sklearn v1.5.1

2025-02-05T02:29:34.930Z

176

머신러닝 적용을 위한 Feature Engineering 작업1

2025-01-22T08:22:19.754Z

185

missingno 대체

2025-01-22T04:56:04.076Z

174

scikit-learn 1.5.1 matplotlib 3.9.2

2025-01-20T04:14:40.998Z

136

환불문의

2024-11-03T06:41:50.486Z

273

자료공유를 받으려고 하는데 에러가 납니다.

2024-10-17T09:16:15.061Z

170

iplot에서 항상 에러나는 분 안계신가용?

2024-09-03T02:25:09.880Z

234

사망 여부 영향 가능성

2024-08-27T16:21:25.031Z

149

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

2024-07-29T15:43:11.312Z

195

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

2024-07-07T09:38:17.458Z

288

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

2024-05-13T23:05:14.074Z

252

3강 강의 자료 코드 관련 질문입니다

2024-03-24T14:22:53.899Z

344

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

2024-03-19T15:05:30.190Z

427

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

2024-02-02T02:09:35.244Z

887

Bayesian Optimization LightGBM 적용

2024-01-31T14:02:35.694Z

467

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

2024-01-25T03:42:24.051Z

347

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

2023-12-17T04:24:18.996Z

218

강의 중 에러 질문

2023-11-06T13:18:46.678Z

753

cross_val_score 에러

2023-10-02T07:56:48.218Z

470