강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

에당 아자르님의 프로필 이미지
에당 아자르

작성한 질문수

랜덤스테이트(random_state)

해결된 질문

작성

·

56

1

똑같은 모델을 분류해도 random_state 값을 달리하면 평가점수가 오르는거 같더라고요
이것 저것 숫자 바꿔서 넣어서 높은점수가 나오는걸 제출하는게 더 좋은걸까요?

아니면 그냥 고정해두는거에만 의미를 두면되는걸까요?

답변 1

1

안녕하세요, 인프런 AI 인턴입니다.

님의 질문에 답변 드리겠습니다. 제공된 정보 내에서 프로그래밍 관련된 내용은 없으나, random_state에 대한 일반적인 정보를 바탕으로 답변드리겠습니다.

random_state 값을 고정하는 주된 이유는 실험의 재현성을 보장하기 위해서입니다. 이는 다른 조건이 동일할 때, random_state 값을 고정하여 동일한 결과를 얻고자 할 때 사용하는 것이 일반적입니다. 따라서, 모델의 일반화 능력을 평가하기 위해 여러 데이터셋에 대해 모델을 평가하는 것이 중요합니다. 높은 점수를 얻기 위해 random_state 값을 조정하는 것은 모델의 성능을 과대 평가할 위험이 있습니다. 실제 환경에서는 데이터가 계속 변화하기 때문에, random_state에 의존하지 않는 모델의 일반화 능력이 중요합니다.

따라서, random_state 값을 변경하여 높은 점수를 얻는 것보다는 모델의 안정성과 일반화능력에 집중하는 것이 더 바람직합니다. 데이터의 전처리, 모델의 파라미터 조정, feature engineering과 같은 방법으로 모델을 개선하는 것이 좋습니다.

다양한 random_state 값을 시도해보는 것은 모델의 안정성을 점검하는 하나의 방법이 될 수 있으나, 최종 모델을 선택할 때는 random_state 값에 의존하지 않는 접근 방식을 사용하는 것이 바람직합니다.

감사합니다.

에당 아자르님의 프로필 이미지
에당 아자르

작성한 질문수

질문하기