예시문제 작업형2
데이터 전처리할 때 왜 id를 삭제하나요?
학습할 때 필요할 지
테스트의 id값이 최종적으로 필요할 지 어떻게 아나요?
답변 1
1
train에서 id를 삭제하는 이유
id값은 모든 데이터(행)이 다른 값을 가지고 있어요. 모델을 만들 때 중요한 피처(컬럼, 변수)가 아니어서 삭제했어요
또한 인코딩하거나 스케일링할 때 id도 함께 변경이 되어버려 그렇습니다.
만약 id를 삭제하는 것이 번거롭다면 그대로 사용해도 됩니다. 머신러닝 모델이 알아서 중요도를 낮게 지정할 거에요(그대로 사용한다면 test에서도 그대로 사용해야 함, 컬럼 수가 동일해야 합니다.)
최종적으로 csv를 만드는 형식을 보면 됩니다. id(또는 index)와 pred(예측값)이라면 test id가 필요합니다. 별도로 저장이 필요해요 ~ 다만 6회 시험은 예측 컬럼만 제출하라고 얼마 전 안내되어 필요하지 않습니다
뒤로가기 버튼 같은 것이 있나요?
0
31
1
강의 연장 문의
0
36
1
출력값 질문
0
33
2
수업노트가 어디에 있나요?
0
33
1
실기시험 제출관련
0
164
2
6.20 작업형 2 과적합
0
171
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
56
2
로지스틱회귀, 회귀
0
53
2
회귀 문제를 풀때 질문입니다.
0
60
1
불균형 처리 후 성능이 더 낮아졌다면,
0
67
2
실기 체험 제2유형 에러 문의
0
67
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
53
2
3번문제 등분산 가정
0
51
2
작업형3 target 형 변환 질문
0
39
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
41
3
원핫인코딩과 레이블 인코딩에서 concat
0
63
2
제2유형 질문입니다.
0
50
2
C()
0
45
2
작업형 2에서 strafity 적용 유무
0
56
2
수강 기간 연장 가능 여부 문의드립니다.
0
64
1
ols
0
45
2
2유형 작성관련 질문(일반 심화)
0
42
2
2유형 작성관련 질문
0
43
2
2유형 object컬럼 개수 다르면
0
50
2





