작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.
작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.
# id 삭제함 (단 test의 id값은 csv파일을 생성할 때 필요함으로 옮겨 놓음) X_train=X_train.drop(['cust_id'], axis=1) cust_id=X_test.pop('cust_id')
만약 id값을 삭제하지 않고 실행해도 문제가 없을까요?
실제 시험에서 어떤 값을 삭제하고 test에서 pop해야하는 지 판단 기준이 궁금합니다..!
답변 1
1
학습(training)할 때 id 값은 필요가 없어서 삭제했습니다. 하지만 이 부분이 어렵다면 id 값을 그대로 두고 진행해도 됩니다. 모델이 알아서 중요도가 낮은 컬럼으로 인식해요!
id는 고유값이고 100개의 행이 있다면 모두 id가 다릅니다. 예측에 크게 도움이 되지 않습니다
test의 id를 다른 변수에 담아둔 이유는 최종 결과 제출 형태 때문입니다. id와 예측값을 csv파일로 만들기 위해서는 id를 어딘가에는 저장해 둘 필요가 있습니다.
2~4회 시험에서는 id값과 예측값을 제출하라고 했고 -> 이때는 반드시 id값을 기억하고 있어야 합니다.
5회에서는 id값 없이 예측값만 제출하라고 했어요! -> 이때는 필요가 없습니다.
작업형1 강의 수강 완료 후..
0
10
0
작업형1 모의문제 4번에 3)문제 질문
0
16
2
이상치 전처리 작업
0
25
2
평가결과값 문의
0
27
2
시계열 데이터 날짜와 시간 format
0
31
2
평가지표 F1 스코어 질문드립니다.
0
24
2
작업형 2 기출7회분에서
0
37
2
작업형2 모의문제1 (30강)
0
34
2
수강 기간 연장 문의 드립니다.
0
41
2
수강 계획과 관련해 문의 드립니다.
0
28
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
50
2
작업형 1 -연습문제 4-6
0
38
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
38
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
37
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
61
2
수강기간 연장 문의드립니다
0
48
2
list 문제 질문드립니다~
0
38
2





