inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제2

해결된 질문

162

kyb1053

작성한 질문수 25

0

안녕하세요, 코린이입니다

문제가 age 컬럼의 이상치를 제거하고 제거전후 views 컬럼 편차를 구하는거고..

age 컬럼 이상치를 제거하면 views 컬럼에 있는 age 이상치 행도 같이 날라가나요 ?

 

그래서 제거전후 편차를 구하게 되는걸까요 ?

 

import pandas as pd df = pd.read_csv("members.csv") r1 = df['views'].std() cond = df['age'] <= 0 # print(df.shape) df = df[~cond] # print(df.shape) # print(df.shape) cond = df['age'] == round(df['age'],0) # 소숫점 나이 구하기, 반올림 했을 때 같으면 정수형 , 다르면 소수점 df = df[cond] # print(df.shape) r2 = df['views'].std() print(round(r1 + r2, 2))

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

정형 데이터는 행과 열로 구성된 표입니다.

제거 방식은 행을 제거하거나 열(컬럼)을 제거하는 방식이 있습니다.

age 컬럼의 이상치를 제거하는 과정에서 해당 이상치를 포함하는 행 전체가 데이터프레임에서 제거됩니다.

cond = df['age'] <= 0 코드의 결과는 True 또는 False 입니다. 이 조건을 데이터프레임에 넣으면 df[cond] True인 행만 출력하게 되요.

여기서 df = df[~cond] 와 같이 ~ 표시를 붙였으니 반대로 False 행만 출력합니다.

기출 11회 작업형 2_전체 데이터 학습 여부

0

11

1

예측값 결과 소수점 차이

0

16

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

13

0

전처리 train() test([ ])

0

14

2

작업형 1 배경지식 질문

0

17

2

옳게 풀은건지 질문드립니다!

0

13

1

roc_auc_score

0

22

2

추가질문 합니다

0

13

2

시험환경 구름

0

16

2

2유형 질문드려요

0

13

2

RandomForest vs lgb

0

22

2

전처리 관련질문

0

21

3

작업형3 기출

0

15

2

유형2에서 데이터분할 생략 가능여부

0

27

2

9회 기출 유형3 질문

0

17

2

lgb 기초편

0

12

1

괄호 사용

0

20

2

작업형 2 데이터 전처리 질문

0

20

1

11회 기출 유형 작업형1 문제 3-1

0

17

1

예시문제 작업형2 (ver2023) 질문입니다

0

19

2

Data type에 따른 처리

0

19

2

데이터 전처리 관련

0

17

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

25

2