inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형 2 (구버전)

해결된 질문

219

kwon10375

작성한 질문수 10

0

print(X_train.describe())
print(X_test.describe())
cond1=X_train['총구매액']>=0
cond2=X_train['최대구매액']>=0
cond3=X_test['총구매액']>=0
cond4=X_test['총구매액']>=0

x_train 과 x_test 총구매액과 최대구매액에

음수가 존재하는데 이럴경우는 해당 행을 어떻게

처리하면될까요?

test 데이터의 경우 칼럼은 필요시 삭제 가능하다

행은 삭제하면 안된다고 강의에서 배워서

질문드립니다.

 

수치형 데이터의 경우 민맥스 스케일, 혹은 스탠다드 스케일ㄹ로 스케일링 하므로, 음수(이상치) 처리는 크게

신경쓰지 않아도될것 같기도하구요..!

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

해당 도메인 데이터에 대해 우리는 잘 알지 못합니다. 이상치에 대한 안내가 별도로 있는 것도 아닙니다.

train과 test둘다 음수값이 존재 한다면 해당 도메인에서 이유가 있을 것입니다.

그대로 두는 것이 좋을 것 같아요!

만약 train에만 있고 test에는 없다면 삭제를 고민해볼 수 있지만 그 상황이 아니라면 고민할 필요 없습니다.

그냥 두세요!!

0

kwon10375

넵 명심하겠습니다 ㅎㅎ

작업형2 모의문제1 (30강)

0

18

1

수강 기간 연장 문의 드립니다.

0

21

1

수강 계획과 관련해 문의 드립니다.

0

19

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

45

2

작업형 1 -연습문제 4-6

0

32

2

작업형 1 유형 부분

0

40

2

작업형 1 (삭제예정, 구 버전)

0

50

2

수강기간 연장 문의드립니다.

0

35

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

38

1

인덱스 슬라이싱

0

35

2

질문 드립니다.

0

49

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

47

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

62

2

강의 기간 연장 가능여부 검토 요청건

0

49

2

수강기간 연장 문의 드립니다

0

45

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2

문제 3-2 질문드립니다

0

47

2