작업형2 모의문제2 오타 질문

Question

안녕하세요 선생님, 첫번째 질문 작업형2 모의문제2를 수강하고 있습니다. regressor = RandomForestRegressor()로 정의했다면, 밑에서 fit하는 것도 regressor.fit (X_tr, y_tr)로 정의하는게 맞는지 질문드리려고 합니다. 현재 노트에는 model로 정의가 되어 있습니다. 두번째 질문 수강하다가 보면 선생님께서 강의중에(아마 분류문제) 이정도 정확도?가 나왔으면 추가적으로 피처 엔지니어링이 필요 없이 그냥 제출해도 될 것 같다~ 라고 말씀을 하실 때가 있는데, 이 기준이 궁금합니다. 어느 정도여야 점수를 충분히 받는지, 예측에 있어서도 지표로 이런 판단이 가능한지 궁금합니다. 3.세 번째 질문 작업형2 모의문제 3을 듣고 있습니다. xgboost 하이퍼파라미터 에 대해서 설명을 듣고 있는데, xgbclassifier의 max_depth의 디폴트는 3이라고 max_depth=3을 설정했을 때와 설정하지 않았을 때 값이 같음을 비교해주셨습니다. 그런데 제가 작성했을 때는 max_depth=3을 넣고, 안넣고 했을 떄 값이 다르게 나오는데, 혹시 왜 그런지 아실까요..? (검색했을 때도 xgboost 디폴트 max_depth=3이라고 나와서 말씀해주신게 맞을 것 같은데..) 감사합니다.

퇴근후딴짓 · Answer

모바일이라 세번째 질문을 못 봤네요 !! 😅 Max depth 기본값이 지금 버전에서는 6이네요! 버전에 따라 변동이 있네요

퇴근후딴짓 · Answer

네 맞아요 model은 단순한 변수입니다 regressor로 변경라는 것이 맞아요 이 부분은 주최측에서 평가지표 기준을 제공하지 않아 전처리를 최소화한 첫 제출(베이스라인)을 기준으로 이보다 검증데이터 기준으로 점수를 좋게해서 제출하는 것으로 정리 하겠습니다😆 개인적으론 이진분류 기준 0.8 부근이면 괜찮은 모델이러 생각합니다만 성능이 너무 낮게 나오는 데이터도 있어 이 말은 무시해주세요!! 결론 본인이 만든 베이스라인보 조금 더 좋은 점수를 제출하는 것으로!!