인프런 커뮤니티 질문&답변
[89페이지] 테스트 세트의 소득 카테고리 비율에 대해 질문이 있습니다.
작성
·
296
0
안녕하세요:) 항상 잘 보고 있습니다.
89페이지의
strat_test_set["income_cat"].value_counts() / len(strat_test_set)
부분에서 질문이 있습니다.
앞의 부분의 코드도 책과 다르게 작성한 부분이 없고, 이 전까지는 전부 똑같은 결과가 나오다가 이 라인에서 결과 값이
3 0.350533 2 0.318798 4 0.176357 5 0.114341 1 0.039971 Name: income_cat, dtype: float64
이렇게 나오게 되었습니다.
네번째와 다섯번째 줄의 결과를 보면 소수점 네 자리 수부터 조금씩 다르게 나오고, 점점 진행하다 보니 나중에는 116페이지의
grid_search.best_params_
코드를 진행할 때에도 max_features의 값이 6으로 나오는 등 계속해서 결과값이 달라지게 되었습니다.
이 부분에 대해서 어떤 식으로 해결하는 것이 좋을지 여쭤보고 싶습니다!
감사합니다:)
퀴즈
머신러닝 모델의 성능을 평가할 때, 훈련 세트와 테스트 세트를 분할하는 주된 이유는 무엇일까요?
모델 훈련 시간 단축
데이터 불균형 문제 해결
모델이 보지 못한 데이터에 대한 일반화 성능 확인
특성 간의 상관관계 분석
답변 1
1
박해선
지식공유자
안녕하세요. 박해선입니다.
라이브러리 버전에 따라 결괏값이 조금씩 달라질 수 있습니다. 작은 값 변화에 너무 신경쓰지 마시고 과정을 익히시는데 초점을 맞추세요.
감사합니다! :)





아하 그렇군요!!
알겠습니다 더 진행해보겠습니다:)
감사합니다:)