강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

민지님의 프로필 이미지
민지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형1] 연습문제 섹션9번 문제

작성

·

28

·

수정됨

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

문제에서 결측치는 제외라고 되어있어서 dropna()를 해주었는데, 결측치는 제거가 되었으나 views 컬럼 값이 1000이하인 행들이 나오지 않습니다.. 뭐가 문제인가요??

 

 

image.png

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

view 컬럼이 결측치 인 것만 제거되어야 하는데

다른 컬럼이 결측치 인 것도 제거되어

1000이하가 없나봅니다

아래와 같은 코드로 부탁드려요!

 

df = df.dropna(subset=['view'])

민지님의 프로필 이미지
민지
질문자

아~ 해결되었습니다! 감사합니다!

0

안녕하세요, 인프런 AI 인턴입니다. 민지님이 자료형1 연습문제에서 views 값이 1000 이하인 행을 필터링하는 데 문제가 있다고 하셨네요.

먼저 결측치 제거와 데이터 필터링에 대한 문제를 해결하기 위한 몇 가지 확인 사항을 짚어드리겠습니다.

결측치 제거 후 조회 문제

결측치를 dropna() 함수로 성공적으로 제거하셨다면, 데이터 프레임은 결측치가 없어진 상태일 것입니다. 이제 views 컬럼의 값이 1000 이하인 행을 찾는 것에 집중해야 합니다.

가능성 있는 문제와 해결 방법

  1. 정렬되지 않은 데이터: views 컬럼이 올바른 형식으로 저장되어 있는지 확인해 보세요. 예를 들어, intfloat 형식이어야 합니다. 만약 문자열로 저장되어 있다면 필터링이 제대로 작동하지 않을 수 있습니다.
   df['views'] = pd.to_numeric(df['views'], errors='coerce')
  1. 조건 확인: 필터링 조건이 잘못 작성되었을 가능성이 있습니다. views <= 1000 조건을 정확히 적용해주세요.
   filtered_df = df[df['views'] <= 1000]
  1. 데이터 확인: 불필요한 공백이나 특수 문자가 데이터에 포함되어 있다면, 올바르게 인식되지 않을 수 있습니다. views 컬럼의 데이터 유형과 값들을 확인해 보고 필요하면 청소 작업을 수행해 주세요.

  2. 결과 재확인: 필터 조건을 적용한 후에 결과가 여전히 비어 있는지 다시 한번 확인하세요.

유사한 질문과 답변

다음 게시물을 참고하면 도움이 될 수 있습니다:
- 캐글 작업형 1-6 결측치 제거: pd.to_numeric 사용하여 데이터형 변환을 설명합니다.
- 작업형1 모의문제1 관련 질문입니다.: 결측치 제거에 대한 다양한 접근 방식을 확인할 수 있습니다.

위 내용을 통해 문제를 해결하시길 바랍니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

민지님의 프로필 이미지
민지

작성한 질문수

질문하기