inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[예시문제 작업형2] EDA 중 이상치 처리

해결된 질문

418

가보자고

작성한 질문수 9

0

안녕하세요.

강의 잘 듣고 있습니다.

예시문제 작업형2 풀면서

X_train.describe() 기초통계량 볼 때(3:56)

총 구매액, 최대 구매액의 최소값이 음수여서...

이상치로 판단하고 금액이 <0인 행은 drop..처리하고 했는데 괜찮은 걸까요?

괜찮다면 결측치처리를 X_train, y_train 동시에 해주는 것처럼 결측치도 두 데이터에 모두 해줘야하는거죠?

캡처.PNG

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

  1. test데이터에도 음수인 값이 있는지 확인이 필요해요! 만약 있다면 해당 도메인에서 이런 데이터가 나오는 이유가 있을 수도 있기에 제거는 살짝 고민을 해봐야 합니다.

  2. 제가 추천하는 방식은 최소한의 전처리로 베이스라인(기초) 모델을 만들고 평가 점수를 기록한 다음
    이상치 처리 등의 전처리 후 결과를 비교하는 것이 좋습니다. 모든 전처리의 기준을 베이스라인을 기준과 비교하는 방식을 추천해요!

 

0

가보자고

감사합니다!

작업형1 강의 수강 완료 후..

0

8

0

작업형1 모의문제 4번에 3)문제 질문

0

15

2

이상치 전처리 작업

0

22

2

평가결과값 문의

0

27

2

시계열 데이터 날짜와 시간 format

0

31

2

평가지표 F1 스코어 질문드립니다.

0

24

2

작업형 2 기출7회분에서

0

37

2

작업형2 모의문제1 (30강)

0

34

2

수강 기간 연장 문의 드립니다.

0

41

2

수강 계획과 관련해 문의 드립니다.

0

28

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

50

2

작업형 1 -연습문제 4-6

0

38

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

38

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

37

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

61

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2