inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

타겟 분리

2

aa

投稿した質問数 2

0

결측치 처리 전에 타겟 변수를 먼저 분리한 후에 결측치 처리를 해야하나요?

저번엔 결측치 처리 전에 무조건 타겟변수를 먼저 분리하라고 하셨는데,

이번에는 분리를 따로 안하셔서요.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. aa님께서 데이터 전처리에서 결측치 처리와 타겟 변수 분리에 대해 궁금한 점을 남겨주셨군요. 관련된 정보를 제공하겠습니다.

  1. 타겟 분리의 기본 개념: 일반적으로 타겟 변수를 먼저 분리하는 이유는, 전처리 과정에서 타겟 변수가 기계 학습 모델의 예측에 영향을 미치지 않도록 하기 위함입니다. 타겟 컬럼에 결측치를 대체하거나 변경하게 되면 모델 학습 시 혼란을 초래할 수 있으며, 타겟 데이터는 변하지 않는 원본 상태로 유지하는 것이 좋습니다.

  2. 결측치 처리 과정: 결측치 처리 시 타겟을 이미 분리한 상태라면 피처 값들에 대해서만 결측치를 다루게 됩니다. 이는 모델 학습 시 타겟 값이 다른 피처의 결측치 처리에 영향을 미치지 않도록 설계하는 데 유리합니다.

관련된 유사한 질문 답변을 참고하시면 좀 더 깊이 있는 이해를 가지실 수 있습니다:
- 타겟 데이터 분리 후 원-핫 인코딩
- 데이터 전처리시 궁금점!

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Id 삭제

0

4

1

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

7

1

원핫인코딩 코드 질문

0

10

1

map 함수 사용 필수적인가요

0

15

1

수강 기한 연장 문의드립니다.

0

18

1

34강 평가지표

0

22

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

14

2

작업형1_section14 문의

0

13

2

작업형1_연습문제 7번 관련입니다.

0

15

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

13

2

크로스 밸리데이션 질문

0

20

2

로지스틱 회귀분석 질문

0

16

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

24

2

2유형 object 컬럼 인코딩 관련 질문

0

34

2

하이퍼파라미터 변수

0

29

2

52강 이원분산분석

0

27

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

33

2

독립표본검정

0

26

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

38

2

df.describe() 사용을 자제해야할까요?

0

38

2

shape 결과에 대한 문의

0

39

2

자료 문의

0

31

2

8 회귀 11번

0

29

2

심화 강의 관련 질문

0

39

2