inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

자주 활용되는 파이썬 예제

kaggle 오류

해결된 질문

202

지현

작성한 질문수 3

0

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

혹시 반복분이나 재귀함수를 잘못 사용한 것이 아닌가 싶은데

코드를 공유해줄래요?

0

지현

import pandas as pd

df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv')

df.isnull().sum()
# f1 31
# f3 95

# df.shape
# (100, 8)

# 결측치가 80%이상 되는 컬럼은(변수는) 삭제 (f3)
df['f3']=df['f3'].dropna
df.isnull().sum()

# city=df.groupby('city')['f1'].median()
# 경기    58.0
# 대구    75.0
# 부산    62.0
# 서울    68.0

kk=df['city']=='경기'
df[kk]

0

지현

image

 

0

퇴근후딴짓

df['f3'].dropna

에서 dropna는 함수(메서드) 입니다. 괄호가 필요해요!!

 

우리가 사용하는 것 중에

괄호를 사용하지 않는건 shape과 시계열 데이터를 다룰 때 dt.year, dt.month 등이에요!

0

지현

image말씀해주신대로 dropna에 괄호를 추가했는데요

또 궁금한 점이... 분명 f3 컬럼에는 95개의 결측치가 있는 걸 확인했는데

df['f3']=df['f3'].dropna()를 했는데 왜 결측치가 제거되지 않고 그대로인걸까요..?

1

퇴근후딴짓

df['f3'].dropna()를 실행했을 때, 'f3' 컬럼에서 결측치가 제거된 새로운 Series를 생성하지만, 해당 컬럼에게만 대입합니다. 따라서, 원본 DataFrame df에는 변화가 없습니다.

만약 'f3' 컬럼의 결측치가 있는 모든 행을 DataFrame에서 완전히 제거하고 싶다면, DataFrame 전체에 dropna()를 적용해야 합니다. 이 경우, 'f3' 컬럼 뿐만 아니라 다른 컬럼에서도 결측치가 있는 행들이 모두 제거됩니다.

python코드 복사df = df.dropna(subset=['f3'])  # 'f3' 컬럼에서 결측치가 있는 행만 제거

1

지현

감사합니다!!!

0

퇴근후딴짓

응원합니다 🙂

3번문제 등분산 가정

0

7

1

작업형3 target 형 변환 질문

0

7

1

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

6

2

원핫인코딩과 레이블 인코딩에서 concat

0

21

2

제2유형 질문입니다.

0

27

2

C()

0

25

2

작업형 2에서 strafity 적용 유무

0

29

2

수강 기간 연장 가능 여부 문의드립니다.

0

30

1

ols

0

27

2

2유형 작성관련 질문(일반 심화)

0

24

2

2유형 작성관련 질문

0

23

2

2유형 object컬럼 개수 다르면

0

28

2

코딩팡질문이요ㅠㅠ

0

23

2

관찰값과 기대값의 개념이 헷갈립니다.

0

15

2

작업형2 ID 컬럼 삭제 질문

0

25

2

2유형 작성관련 질문

0

21

2

memoryerror 질문

0

19

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

24

1

ID 삭제 필수 인가요?

0

22

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

20

2

3 유형 귀무가설, 대립가설

0

22

2

인코딩 관련 질문 있습니다

0

26

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

33

2

2유형 원핫인코딩 오류

0

24

2