inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형1] 연습문제 섹션1 ~ 10

작업형1 연습문제 섹션9

해결된 질문

44

fndwl

작성한 질문수 1

0

연습문제 섹션9 문제

에서 결측치 제외가 있어서 이렇게 작성하였는데 풀이에는 결측치 제거 과정이 없어서요.. 답은 동일하지만 결측치 제거를 하지 않아도 괜찮은가요? (제거 전 views 컬럼 결측치는 4개가 나옵니다.)

# print(df.isnull().sum())
cond1 = df['views'] <= 1000
cond2 = df['views'].isnull()
df = df[cond1 & ~cond2]
# print(df.isnull().sum())
df['f4'].mode()[0]
# df['f4'].value_counts()
# ISFJ

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

df['views'] <= 1000 조건에 걸려서 결측치는 선택이 되지 않아 0개가 나옵니다.

아래 코드 확인!!

화이팅~~!!

 

# views수가 1000이하
cond = df['views'] <= 1000
df = df[cond]
df['views'].isnull().sum()

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. fndwl님이 질문에서 ‘views’ 컬럼의 결측치를 제거해야 하는지에 대한 의문을 가지셨군요.

질문 요약

문제는 ‘views’ 컬럼 값이 1000 이하인 데이터를 검색하고, 그 중 ‘f4’ 컬럼의 최빈값을 찾는 것입니다. fndwl님께서는 결측치를 제거하는 코드(dropna())와 함께 조건을 구성하셨습니다.

결측치 제거의 필요성

  1. 결측치 제거 여부: 특정 문제에서 결측치 제거가 필요할 수도 있습니다. 결측치는 분석에 있어 정확한 판단을 해야 하는 경우, 기초 데이터의 왜곡을 막기 위해 제거하는 것이 일반적인 접근입니다.

  2. 문제 명확화: 여기서 문제의 명시가 “결측치 제외”라고 되어 있는 경우, 결측치를 제거하는 것이 필요합니다. 따라서, 여러분이 적절한 전처리를 했다고 볼 수 있습니다.

  3. 결과의 일관성: 결측치가 포함된 데이터와 그렇지 않은 데이터에서 분석 결과가 달라질 수 있으므로, 문제의 명시대로 수행하는 것이 중요합니다.

해결 과정 설명

다음과 같이 문제를 해결하는 방법을 통해 결측치와 필터링을 수행할 수 있음을 보여줍니다:

  1. df['views'].isnull()을 통해 결측치를 판별하고, ~cond2를 통해 결측치를 제외한 데이터를 필터링합니다.
  2. ‘views’ 컬럼이 1000 이하인 데이터만 cond1을 이용해 필터링합니다.
  3. ‘f4’ 컬럼의 최빈값을 df['f4'].mode()[0]을 이용해 구합니다.

유사한 질문

다음 링크를 참고하시면 도움이 될 수 있습니다:
- 작업형1 모의문제1 관련 질문입니다.: 결측치 제거와 관련된 다양한 접근을 확인할 수 있습니다.
- 캐글 작업형 1-6 결측치 제거: pd.to_numeric를 사용하여 데이터형 변환을 설명합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

대응표본검정 레빈

0

6

2

단일표본검정 문제 유형

0

10

2

[작업형 3] 6~7. 카이제곱 검정

0

11

2

9회 작업형3 문제 1-1

0

15

2

최종답안 계산 방식 질문

0

12

1

시험 치기 전 급하게 질문 사항

0

19

2

유형3

0

19

2

작업형 2 연습문제 섹션 3

0

13

2

11 기출문제 ipynb파일

0

17

2

작업형 3 유형

0

18

2

11회 기출 유형(작업형1) 2번 정답

0

17

2

f1 score 질문

0

18

2

10회 작업형 2 인코딩 질의

0

13

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

19

2

28:19 roc_auc이유

0

18

2

수강연장문의

0

20

2

전체적인 머신러닝 순서

0

23

2

빅분기 실기 유형2질문

0

24

1

ID 전처리 이유

0

31

2

데이터제공

0

29

2

예시문제 작업형3 꼬리질문2번

0

21

1

데이터 개수를 구할 때, len과 value_counts 차이

0

28

2

작업형 2 제출방

0

21

2

인코딩 스케일링 순서

0

23

2