강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

이현민님의 프로필 이미지
이현민

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[14/20] distplot, ridgeplot, pairplot 으로 시각화와 서브플롯 그리기

질문

작성

·

223

1

  • df_last_notnull= df_last.loc[df_last["평당분양가격"].notnull(),

여기서 df_last로 헌번더 묶어주는 이유가 있을까요??

바로 loc[df_last["평당분양가격"] 이런식으로 하면 안되나여

퀴즈

41%나 틀려요. 한번 도전해보세요!

Pandas로 CSV 파일을 읽어올 때, 한글이 깨지는 유니코드 디코드 에러가 발생했다면 어떻게 해결해야 할까요?

파일 확장자를 .txt로 변경한다

read_csv 함수에 encoding 인자를 지정한다

Pandas 대신 NumPy 라이브러리를 사용한다

데이터 파일명을 영어로 변경한다

답변 1

0

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

아래 코드를 실행하면 True, False 로 된 결과가 나옵니다. 

조건에 만족하면 True 그렇지 않으면 False 가 나오게 되는데 이 때 인덱스 번호가 같이 표시되는걸 확인해 보실 수 있을거에요.

df_last["평당분양가격"].notnull()

그 결과를  다시 df_last 로 감싸면  해당 조건에 만족하는 데이터에 대한 서브셋을 가져오게 되는데요.

True, False 로 나온 결과를 인덱싱 해온다 해서 이렇게 데이터를 탐색하는 것을 Bool Indexing 이라고 부릅니다.

질문주신 loc 를 사용할 때도 아래와 같이 작성해 주셔야 합니다.

df_last.loc[df_last["평당분양가격"].notnull(), "평당분양가격"]

이현민님의 프로필 이미지
이현민

작성한 질문수

질문하기