inflearn logo
강의

講義

知識共有

本番データサイエンス Part2.データ前処理

外れ値除去

6 시그마 이상 outlier

557

donggeunko2496

投稿した質問数 7

0

안녕하세요.

6 시그마 이상인 값들은 이상치에 해당되는 샘플이라고 하셨는데 그 이유를 알 수있을까요? 수학적이라던지 아니면 통계학적으로라던지 근거를 알 수 있을까요? 

outlier python 이상치

回答 1

0

hjkim3

안녕하세요.

6 시그마는 예를 든 것입니다. 매우 드물게 발생할 확률을 말할때 상징적으로 6 시그마를 (표준편차)를 말합니다.

경우에 따라서 3이나 4를 선택할 수도 있습니다. 이상치의 정도는 상황에 따라 정하기 나름입니다~

작업형 1 배경지식 질문

0

3

1

옳게 풀은건지 질문드립니다!

0

3

0

roc_auc_score

0

5

1

재귀함수 연산법

0

6

1

추가질문 합니다

0

11

1

시험환경 구름

0

11

1

2유형 질문드려요

0

8

1

RandomForest vs lgb

0

18

1

전처리 관련질문

0

13

2

수강기간즘연장해주세요

0

8

1

작업형3 기출

0

13

1

유형2에서 데이터분할 생략 가능여부

0

20

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

10

1

수업자료 문의

0

16

2

괄호 사용

0

15

1

결측값 처리

0

576

1

n_step 값에 대하여

0

451

1

dir*.csv가 안됩니다.

0

327

1

로그변환에 대하여

0

644

1

In[42] 14:50 코드 질문

0

248

1

Titanic 데이터셋 PClass cateogrical -> one hot encoding

0

385

1

표준 스케일링관련 문의

0

317

1

6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문

0

740

1