이상치 IQR 처리
0
cols = list(X_train.columns[X_train.dtypes != object])
print(cols)
for col in cols:
Q1 = X_train[col].quantile(0.25)
Q3 = X_train[col].quantile(0.75)
IQR = Q3 - Q1
min_iqr = Q1 - 1.5*IQR
max_iqr = Q3 + 1.5*IQR
X_train.loc[X_train[col]<min, col] = min_iqr
X_train.loc[X_train[col]>max, col] = max_iqr
print(X_train)이렇게 하고 X_test도 똑같이 해도 될까요?
답변 1
1
아니요! 테스트에 이렇게 적용하면 0점입니다 테스트 데이터의 행(레코드)는 삭제되면 절대 안됩니다
iqr 이상치 처리가 좋을 때도 있는데 데이터에 따라 너무 많은 데이터가 삭제되기도 해요~
이상치 처리는 문제에 명시된 것이나 나이(age)처럼 누구나 알 수 있는 것이 아니면 권장하지 않습니다
시계열 데이터 날짜와 시간 format
0
15
1
평가지표 F1 스코어 질문드립니다.
0
16
2
작업형 2 기출7회분에서
0
32
2
작업형2 모의문제1 (30강)
0
28
2
수강 기간 연장 문의 드립니다.
0
35
2
수강 계획과 관련해 문의 드립니다.
0
26
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
49
2
작업형 1 -연습문제 4-6
0
35
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
37
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
36
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
48
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
63
2
강의 기간 연장 가능여부 검토 요청건
0
51
2
수강기간 연장 문의 드립니다
0
46
2
수강기간 연장 문의드립니다
0
52
2





