강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

freedom07님의 프로필 이미지
freedom07

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런 소개와 머신러닝 분류 예측 모델 개요

DecisionTreeClassifier 객체 생성시 random_state하는 이유?

작성

·

953

0

선생님~

학습 데이터와 테스트 데이터 세트로 분리를 할 때 

X_train, X_test, y_train, y_test = train_test_split(iris_data, iris_label,  test_size=0.2, random_state=11)

이렇게 random_state 를 쓰는 이유는 이해가 되는데..

(반복실행해도 train데이터셋과 test데이터셋을 나눈 결과를 똑같이(고정하는 의미) 보이게 하려고)

DecisionTreeClassifier 객체를 생성시,  

dt_clf = DecisionTreeClassifier(random_state=11)

이렇게 rrandom_state를 쓰는 이유는 무엇인가요~?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

DecisionTree도 비슷합니다. 다만 DecisionTree의 내부 알고리즘이 구동시 random하게 feature들과 데이터 건수를 선택하는 로직이 포함되어 있습니다.

때문에 random_state로 특정값을 지정하여 DecisionTree 수행시 마다 동일한 Rule 트리를 만들 수 있도록 합니다

freedom07님의 프로필 이미지
freedom07

작성한 질문수

질문하기