inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

[Loại thực hành] Bài tập luyện tập Phần 11 ~ 20

데이터 프레임을 변경해도 되나요?

1

rkdgus56684698

4 câu hỏi đã được viết

0

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 이강현님!

질문하신 내용은 데이터프레임에서 IQR을 계산하고 새 컬럼에 저장하는 방법에 대한 것입니다. 기존의 데이터프레임에 새로운 컬럼을 추가하는 것은 코드의 가독성을 높이고 결과를 명확하게 보기 쉽게 만드는 좋은 방법입니다. 시험 점수에는 전혀 영향을 미치지 않으니 안심하고 사용하셔도 됩니다. 다만, 코드의 요구사항에 따라 결과를 도출하는지 주의 깊게 확인하시면 좋습니다.

IQR 및 이상치 탐지 방법

기본적으로, pandas를 이용해 사분위수를 계산하고 IQR을 활용하여 이상치를 탐지한 후, 해당 결과를 새 컬럼에 저장하는 예제를 보겠습니다:

import pandas as pd

# 데이터프레임 생성
df=pd.read_csv('members.csv')

# Q1, Q3 및 IQR 계산
df['1qr'] = df['views'].quantile(0.25)
df['3qr'] = df['views'].quantile(0.75)
df['IQR'] = df['3qr'] - df['1qr']

# 이상치 조건에 따른 필터링
df['is_outlier'] = (df['views'] < df['1qr'] - 1.5 * df['IQR']) | (df['views'] > df['3qr'] + 1.5 * df['IQR'])

# 이상치 데이터의 'views' 컬럼 합 계산
outlier_sum = df.loc[df['is_outlier'], 'views'].sum()
print(int(outlier_sum))

이처럼, 필요에 따라 새 컬럼을 만들어 값을 저장함으로써 데이터를 효율적으로 핸들링할 수 있습니다.

질문에 대한 추가적인 유사한 해결 방법을 다른 수강생들도 공유한 적이 있습니다. 도움이 될 수 있는 자료를 아래에 첨부하겠습니다:

위 링크들은 IQR을 활용한 이상치 탐지를 보다 깊게 이해하는 데 도움을 줄 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

10회 기출 작업형3 문제 2-1 질문

0

4

1

작업형 2 질문

0

8

1

작업형 2 템플릿 확인 요청

0

7

1

작업형2 인코딩 질문

0

20

2

작업형 3 벼락치기 공부방법 질문

0

27

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

30

2

예측값 결과 소수점 차이

0

25

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

31

1

전처리 train() test([ ])

0

21

2

작업형 1 배경지식 질문

0

29

2

옳게 풀은건지 질문드립니다!

0

20

1

roc_auc_score

0

29

2

추가질문 합니다

0

21

2

시험환경 구름

0

19

2

2유형 질문드려요

0

19

2

RandomForest vs lgb

0

26

2

전처리 관련질문

0

29

3

작업형3 기출

0

19

2

유형2에서 데이터분할 생략 가능여부

0

30

2

9회 기출 유형3 질문

0

21

2

lgb 기초편

0

22

2

괄호 사용

0

27

2

작업형 2 데이터 전처리 질문

0

24

1

11회 기출 유형 작업형1 문제 3-1

0

27

1