inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

타겟 데이터 분리

해결된 질문

222

작성한 질문수 7

0

안녕하세요.

데이터 전처리 단계에서 target = train.pop('target') 타겟 처리하는 방법과

검증 데이터 분리 단계에서

이렇게 하는 방법 중에 어떤방법을 선택하던 결과에 영향이 없나요?

그리고 데이터 전처리 시에 target분리할 경우에 target 데이터가 수치형이나 범주형 상관 없이 데이터 전처리 전에 분리하면 되는건지요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

네! 상관없습니다.

동일한 코드를 원한다면 전처리 시작과 동시에

target = train.pop('target') 처리하고 시작하시죠!!
꿀팁에 있는 아래 영상에서는 한가지 방법으로만 풀이 했어요!

기출(작업형2) 한 가지 방법으로 풀기 🆕 updated 2024.6

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 윰님께서 데이터 전처리와 타겟 처리에 대해 궁금하신 점을 남겨주셨군요. 관련된 몇 가지 기존의 유사한 질문답변과 함께 설명드립니다.

  1. 타겟 데이터 분리에 대한 주요 개념: 타겟 데이터를 전처리의 초기 단계에서 분리하는 것은 일반적입니다. 이는 데이터 변환이나 인코딩 과정에서 타겟 데이터가 변경되지 않도록 하기 위함입니다. 타겟 변수가 수치형이든 범주형이든, 일반적으로 전처리 전에 분리하는 것이 좋습니다.

  2. 타겟 인코딩 문제: 만약 타겟이 범주형 데이터라면, 일부 알고리즘들(예: XGBoost)에서는 타겟을 ‘라벨 인코딩’ 해야 할 수도 있습니다. 하지만 일반적으로는 타겟을 원본 그대로 유지한 후, 기계 학습 모델에서 처리되기를 선호합니다. 관련된 질문과 답변에서 “target, 즉 우리가 예측하려는 값이 범주형인 경우”라는 문제를 다루고 있습니다.

  3. 측정 및 평가 지표: 타겟의 특성에 따라 모델 평가 지표를 결정할 때 양성 값 등으로 지정하는 방법도 중요합니다. 이 점은 위의 링크된 답변에서 자세히 설명하고 있습니다.

  4. 데이터 전처리 및 팝 방법: 데이터 프레임에서 타겟을 분리할 때 ‘pop’ 함수를 사용하면, 기존 데이터 프레임에서 타겟 열이 사라지면서 따로 반환됩니다. 이 방식은 명확한 전처리 흐름을 유지할 수 있게 도와줍니다.

더 많은 정보는 관련 데이터 전처리시 궁금점! 포스팅에서 확인할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

34강 평가지표

0

15

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

8

2

작업형1_section14 문의

0

8

2

작업형1_연습문제 7번 관련입니다.

0

10

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

10

2

크로스 밸리데이션 질문

0

14

2

로지스틱 회귀분석 질문

0

14

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

23

2

2유형 object 컬럼 인코딩 관련 질문

0

32

2

하이퍼파라미터 변수

0

29

2

52강 이원분산분석

0

26

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

31

2

독립표본검정

0

25

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

36

2

df.describe() 사용을 자제해야할까요?

0

35

2

shape 결과에 대한 문의

0

37

2

자료 문의

0

31

2

8 회귀 11번

0

26

2

심화 강의 관련 질문

0

36

2

빈도수 구하는 것 질문

0

26

2

커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?

0

38

1

작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의

0

34

2

수강연장가능문의

0

45

2

59. 11회 기출 유형 작업형 1 - 문제2 관련

0

37

2