인프런 커뮤니티 질문&답변

콘스트님의 프로필 이미지
콘스트

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제2 오타 질문

해결된 질문

작성

·

257

·

수정됨

0

안녕하세요 선생님,

  1. 첫번째 질문

작업형2 모의문제2를 수강하고 있습니다.

regressor = RandomForestRegressor()로 정의했다면,

밑에서 fit하는 것도 regressor.fit(X_tr, y_tr)로 정의하는게 맞는지 질문드리려고 합니다.

현재 노트에는 model로 정의가 되어 있습니다.

  1. 두번째 질문

    수강하다가 보면 선생님께서 강의중에(아마 분류문제) 이정도 정확도?가 나왔으면 추가적으로 피처 엔지니어링이 필요 없이 그냥 제출해도 될 것 같다~ 라고 말씀을 하실 때가 있는데, 이 기준이 궁금합니다. 어느 정도여야 점수를 충분히 받는지,

    예측에 있어서도 지표로 이런 판단이 가능한지 궁금합니다.

 3.세 번째 질문

작업형2 모의문제 3을 듣고 있습니다.

xgboost 하이퍼파라미터 에 대해서 설명을 듣고 있는데, xgbclassifier의 max_depth의 디폴트는 3이라고 max_depth=3을 설정했을 때와 설정하지 않았을 때 값이 같음을 비교해주셨습니다.

그런데 제가 작성했을 때는 max_depth=3을 넣고, 안넣고 했을 떄 값이 다르게 나오는데, 혹시 왜 그런지 아실까요..?

(검색했을 때도 xgboost 디폴트 max_depth=3이라고 나와서 말씀해주신게 맞을 것 같은데..)

 

감사합니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

모바일이라 세번째 질문을 못 봤네요 !! 😅

Max depth 기본값이 지금 버전에서는 6이네요!

버전에 따라 변동이 있네요

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. 네 맞아요 model은 단순한 변수입니다 regressor로 변경라는 것이 맞아요

  2. 이 부분은 주최측에서 평가지표 기준을 제공하지 않아 전처리를 최소화한 첫 제출(베이스라인)을 기준으로 이보다 검증데이터 기준으로 점수를 좋게해서 제출하는 것으로 정리 하겠습니다😆

  3. 개인적으론 이진분류 기준 0.8 부근이면 괜찮은 모델이러 생각합니다만 성능이 너무 낮게 나오는 데이터도 있어 이 말은 무시해주세요!!

결론 본인이 만든 베이스라인보 조금 더 좋은 점수를 제출하는 것으로!!

콘스트님의 프로필 이미지
콘스트
질문자

답변 감사합니다! 세번째 질문에 대한 답을 안달아 주셔서 다시 답글 남깁니다!

감사합니다.


3.세 번째 질문

작업형2 모의문제 3을 듣고 있습니다.

xgboost 하이퍼파라미터 에 대해서 설명을 듣고 있는데, xgbclassifier의 max_depth의 디폴트는 3이라고 max_depth=3을 설정했을 때와 설정하지 않았을 때 값이 같음을 비교해주셨습니다.

그런데 제가 작성했을 때는 max_depth=3을 넣고, 안넣고 했을 떄 값이 다르게 나오는데, 혹시 왜 그런지 아실까요..?

(검색했을 때도 xgboost 디폴트 max_depth=3이라고 나와서 말씀해주신게 맞을 것 같은데..)

콘스트님의 프로필 이미지
콘스트

작성한 질문수

질문하기