inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

해결된 질문

560

jnood

작성한 질문수 13

0

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

# id 삭제함 (단 test의 id값은 csv파일을 생성할 때 필요함으로 옮겨 놓음) X_train=X_train.drop(['cust_id'], axis=1) cust_id=X_test.pop('cust_id')

만약 id값을 삭제하지 않고 실행해도 문제가 없을까요?

실제 시험에서 어떤 값을 삭제하고 test에서 pop해야하는 지 판단 기준이 궁금합니다..!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

학습(training)할 때 id 값은 필요가 없어서 삭제했습니다. 하지만 이 부분이 어렵다면 id 값을 그대로 두고 진행해도 됩니다. 모델이 알아서 중요도가 낮은 컬럼으로 인식해요!
id는 고유값이고 100개의 행이 있다면 모두 id가 다릅니다. 예측에 크게 도움이 되지 않습니다
test의 id를 다른 변수에 담아둔 이유는 최종 결과 제출 형태 때문입니다. id와 예측값을 csv파일로 만들기 위해서는 id를 어딘가에는 저장해 둘 필요가 있습니다.

  • 2~4회 시험에서는 id값과 예측값을 제출하라고 했고 -> 이때는 반드시 id값을 기억하고 있어야 합니다.

  • 5회에서는 id값 없이 예측값만 제출하라고 했어요! -> 이때는 필요가 없습니다.

작업형1 강의 수강 완료 후..

0

10

0

작업형1 모의문제 4번에 3)문제 질문

0

16

2

이상치 전처리 작업

0

25

2

평가결과값 문의

0

27

2

시계열 데이터 날짜와 시간 format

0

31

2

평가지표 F1 스코어 질문드립니다.

0

24

2

작업형 2 기출7회분에서

0

37

2

작업형2 모의문제1 (30강)

0

34

2

수강 기간 연장 문의 드립니다.

0

41

2

수강 계획과 관련해 문의 드립니다.

0

28

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

50

2

작업형 1 -연습문제 4-6

0

38

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

38

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

37

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

61

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2