inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형 2 (구버전)

해결된 질문

227

kwon10375

작성한 질문수 10

0

print(X_train.describe())
print(X_test.describe())
cond1=X_train['총구매액']>=0
cond2=X_train['최대구매액']>=0
cond3=X_test['총구매액']>=0
cond4=X_test['총구매액']>=0

x_train 과 x_test 총구매액과 최대구매액에

음수가 존재하는데 이럴경우는 해당 행을 어떻게

처리하면될까요?

test 데이터의 경우 칼럼은 필요시 삭제 가능하다

행은 삭제하면 안된다고 강의에서 배워서

질문드립니다.

 

수치형 데이터의 경우 민맥스 스케일, 혹은 스탠다드 스케일ㄹ로 스케일링 하므로, 음수(이상치) 처리는 크게

신경쓰지 않아도될것 같기도하구요..!

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

해당 도메인 데이터에 대해 우리는 잘 알지 못합니다. 이상치에 대한 안내가 별도로 있는 것도 아닙니다.

train과 test둘다 음수값이 존재 한다면 해당 도메인에서 이유가 있을 것입니다.

그대로 두는 것이 좋을 것 같아요!

만약 train에만 있고 test에는 없다면 삭제를 고민해볼 수 있지만 그 상황이 아니라면 고민할 필요 없습니다.

그냥 두세요!!

0

kwon10375

넵 명심하겠습니다 ㅎㅎ

실기시험 제출관련

0

128

2

6.20 작업형 2 과적합

0

140

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

39

2

로지스틱회귀, 회귀

0

47

2

회귀 문제를 풀때 질문입니다.

0

52

1

불균형 처리 후 성능이 더 낮아졌다면,

0

61

2

실기 체험 제2유형 에러 문의

0

60

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

46

2

3번문제 등분산 가정

0

46

2

작업형3 target 형 변환 질문

0

34

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

36

3

원핫인코딩과 레이블 인코딩에서 concat

0

56

2

제2유형 질문입니다.

0

46

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

49

2

수강 기간 연장 가능 여부 문의드립니다.

0

58

1

ols

0

43

2

2유형 작성관련 질문(일반 심화)

0

38

2

2유형 작성관련 질문

0

39

2

2유형 object컬럼 개수 다르면

0

48

2

코딩팡질문이요ㅠㅠ

0

45

2

관찰값과 기대값의 개념이 헷갈립니다.

0

25

2

작업형2 ID 컬럼 삭제 질문

0

45

2

2유형 작성관련 질문

0

32

2