inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

타겟 분리

4

aa

2 câu hỏi đã được viết

0

결측치 처리 전에 타겟 변수를 먼저 분리한 후에 결측치 처리를 해야하나요?

저번엔 결측치 처리 전에 무조건 타겟변수를 먼저 분리하라고 하셨는데,

이번에는 분리를 따로 안하셔서요.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. aa님께서 데이터 전처리에서 결측치 처리와 타겟 변수 분리에 대해 궁금한 점을 남겨주셨군요. 관련된 정보를 제공하겠습니다.

  1. 타겟 분리의 기본 개념: 일반적으로 타겟 변수를 먼저 분리하는 이유는, 전처리 과정에서 타겟 변수가 기계 학습 모델의 예측에 영향을 미치지 않도록 하기 위함입니다. 타겟 컬럼에 결측치를 대체하거나 변경하게 되면 모델 학습 시 혼란을 초래할 수 있으며, 타겟 데이터는 변하지 않는 원본 상태로 유지하는 것이 좋습니다.

  2. 결측치 처리 과정: 결측치 처리 시 타겟을 이미 분리한 상태라면 피처 값들에 대해서만 결측치를 다루게 됩니다. 이는 모델 학습 시 타겟 값이 다른 피처의 결측치 처리에 영향을 미치지 않도록 설계하는 데 유리합니다.

관련된 유사한 질문 답변을 참고하시면 좀 더 깊이 있는 이해를 가지실 수 있습니다:
- 타겟 데이터 분리 후 원-핫 인코딩
- 데이터 전처리시 궁금점!

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

원핫 인코딩 관련

0

2

1

Id 삭제

0

5

1

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

9

1

원핫인코딩 코드 질문

0

10

1

map 함수 사용 필수적인가요

0

15

1

수강 기한 연장 문의드립니다.

0

18

1

34강 평가지표

0

23

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

14

2

작업형1_section14 문의

0

13

2

작업형1_연습문제 7번 관련입니다.

0

15

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

15

2

크로스 밸리데이션 질문

0

21

2

로지스틱 회귀분석 질문

0

17

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

24

2

2유형 object 컬럼 인코딩 관련 질문

0

34

2

하이퍼파라미터 변수

0

29

2

52강 이원분산분석

0

27

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

33

2

독립표본검정

0

26

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

40

2

df.describe() 사용을 자제해야할까요?

0

38

2

shape 결과에 대한 문의

0

39

2

자료 문의

0

31

2

8 회귀 11번

0

29

2