-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
작업형 제2유형 관련 질문
21.11.29 03:22 작성 조회수 129
0
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
답변을 작성해보세요.
0
companionclub
지식공유자2021.11.29
안녕하세요.
먼저 3번내용을 설명드리면 첫번째 칼럼인 cust_id는 단순히 시퀀셜한 숫자일 뿐 아무의미가 없습니다.
말씀하신 내용이 맞구요. 그 이유로 y_train과 join에만 사용하고 제외했습니다.
아마 시험에서도 마찬가지로 하셔야할 겁니다. 고객ID정도로 생각하시면 될 것 같습니다.
위의 코드를 돌려봤는데
test 데이터는 정답지인(Response) 변수가 없기 때문에 Error가 발생하는 것 같습니다.
모델을 평가하려면 정답지와 에측값을 비교해야되는데 예측값만 존재하고 정답지가 없기 때문입니다.
모델평가를 최종모델전에 t_train, t_test인 단계에서 진행하시면 Error없이 동작하는 것을
확인했습니다. (물론 0.5기준으로 나누면 예측값이 동일해서 Warning이 나오긴하네요.)
> names(train)
[1] "Gender" "Age"
[3] "Driving_License" "Previously_Insured"
[5] "Vehicle_Age" "Vehicle_Damage"
[7] "Annual_Premium" "Policy_Sales_Channel"
[9] "Vintage" "Response"
> names(test)
[1] "Gender" "Age"
[3] "Driving_License" "Previously_Insured"
[5] "Vehicle_Age" "Vehicle_Damage"
[7] "Annual_Premium" "Policy_Sales_Channel"
[9] "Vintage"
답변 1