inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

해결된 질문

567

jnood

작성한 질문수 13

0

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

# id 삭제함 (단 test의 id값은 csv파일을 생성할 때 필요함으로 옮겨 놓음) X_train=X_train.drop(['cust_id'], axis=1) cust_id=X_test.pop('cust_id')

만약 id값을 삭제하지 않고 실행해도 문제가 없을까요?

실제 시험에서 어떤 값을 삭제하고 test에서 pop해야하는 지 판단 기준이 궁금합니다..!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

학습(training)할 때 id 값은 필요가 없어서 삭제했습니다. 하지만 이 부분이 어렵다면 id 값을 그대로 두고 진행해도 됩니다. 모델이 알아서 중요도가 낮은 컬럼으로 인식해요!
id는 고유값이고 100개의 행이 있다면 모두 id가 다릅니다. 예측에 크게 도움이 되지 않습니다
test의 id를 다른 변수에 담아둔 이유는 최종 결과 제출 형태 때문입니다. id와 예측값을 csv파일로 만들기 위해서는 id를 어딘가에는 저장해 둘 필요가 있습니다.

  • 2~4회 시험에서는 id값과 예측값을 제출하라고 했고 -> 이때는 반드시 id값을 기억하고 있어야 합니다.

  • 5회에서는 id값 없이 예측값만 제출하라고 했어요! -> 이때는 필요가 없습니다.

뒤로가기 버튼 같은 것이 있나요?

0

28

1

강의 연장 문의

0

32

1

출력값 질문

0

31

2

수업노트가 어디에 있나요?

0

29

1

실기시험 제출관련

0

160

2

6.20 작업형 2 과적합

0

169

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

52

2

로지스틱회귀, 회귀

0

52

2

회귀 문제를 풀때 질문입니다.

0

59

1

불균형 처리 후 성능이 더 낮아졌다면,

0

66

2

실기 체험 제2유형 에러 문의

0

66

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

52

2

3번문제 등분산 가정

0

50

2

작업형3 target 형 변환 질문

0

38

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

40

3

원핫인코딩과 레이블 인코딩에서 concat

0

62

2

제2유형 질문입니다.

0

49

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

53

2

수강 기간 연장 가능 여부 문의드립니다.

0

63

1

ols

0

44

2

2유형 작성관련 질문(일반 심화)

0

41

2

2유형 작성관련 질문

0

42

2

2유형 object컬럼 개수 다르면

0

49

2