강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

freedom07님의 프로필 이미지
freedom07

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[9/15] 구별 음식점 분석으로 서브셋 만들기 - boolean Indexing 이해하기

loc가 더 연산이 빠른 이유

작성

·

150

1

df[(df["시군구명"]=="강남구") & (df["상권업종대분류명"]=="음식")]["상권업종중분류명"].value_counts()

보다는  loc를 써서 

df.loc[(df["시군구명"]=="강남구") & (df["상권업종대분류명"]=="음식"),"상권업종중분류명"].value_counts()

이렇게 하는게 연산이 더 빠르다고 하셨는데요..

이유가 무엇인가요..??

답변 1

2

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

위의 코드는 데이터프레임을 결과로 반환 받고 다시 "상권업종중분류명"컬럼에 접근하게 됩니다. 결과적으로 데이터프레임에 두 번 접근하게 됩니다.

아래 코드는 데이터프레임에 한번 접근해서 행과 열을 한 번에 가져오게 됩니다.

그래서 아래 코드가 더 빠릅니다.

freedom07님의 프로필 이미지
freedom07

작성한 질문수

질문하기