inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링

2 유형 질문 드립니다

해결된 질문

156

mr.woong0926

작성한 질문수 14

0

안녕하세요!

2유형에서 궁금한 점이 있어 추가 질문드립니다.

 

age 컬럼 같은 경우 음수, 소숫점 등과 같이 명확한 이상치가 보일 경우 결측치를 채우기 전 이상치를 먼저 처리하는게 나을까요?

 

결측치를 평균 혹은 중앙 값으로 채운다고 가정 했을 때, 이상 값이 있으면 성능에 영향을 주지 않을까 싶어서 질문드립니다

 

만약 이상치가 많이 존재하고 이를 처리한다고 하면,

이상치 행을 아예 삭제해야하나요?

아니면 결측치와 마찬가지로 이상치를 제외한 평균, 중앙 값을 계산해서 값을 변경해주는게 좋을까요?

 

오늘도 감사합니다!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

결론: 문제에서 명시하지 않는다면, 이상치는 처리하지 않는 것으로 하시죠!

간혹 필기에서 학습한 IQR을 작업형2에 적용하는 수험생이 있는데 이건 많은 데이터를 삭제해 오히려 독이 되기도합니다.

 

고민의 흔적이 느껴집니다.

데이터마다 다르겠지만 이상치는 극 소수의 데이터라 데이터에서 제외 전이나 제외 후나 값의 큰차이는 없었어요! 명확한 이상치라면 제거하고 계산하는 것이 맞을 것 같아요!

로지스틱회귀, 회귀

0

29

2

회귀 문제를 풀때 질문입니다.

0

33

1

불균형 처리 후 성능이 더 낮아졌다면,

0

46

2

실기 체험 제2유형 에러 문의

0

35

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

36

2

3번문제 등분산 가정

0

35

2

작업형3 target 형 변환 질문

0

30

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

23

3

원핫인코딩과 레이블 인코딩에서 concat

0

44

2

제2유형 질문입니다.

0

39

2

C()

0

36

2

작업형 2에서 strafity 적용 유무

0

44

2

수강 기간 연장 가능 여부 문의드립니다.

0

46

1

ols

0

36

2

2유형 작성관련 질문(일반 심화)

0

31

2

2유형 작성관련 질문

0

30

2

2유형 object컬럼 개수 다르면

0

37

2

코딩팡질문이요ㅠㅠ

0

37

2

관찰값과 기대값의 개념이 헷갈립니다.

0

19

2

작업형2 ID 컬럼 삭제 질문

0

39

2

2유형 작성관련 질문

0

27

2

memoryerror 질문

0

21

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

37

1

ID 삭제 필수 인가요?

0

33

3