• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

loc가 더 연산이 빠른 이유

21.01.29 21:02 작성 조회수 88

1

df[(df["시군구명"]=="강남구") & (df["상권업종대분류명"]=="음식")]["상권업종중분류명"].value_counts()

보다는  loc를 써서 

df.loc[(df["시군구명"]=="강남구") & (df["상권업종대분류명"]=="음식"),"상권업종중분류명"].value_counts()

이렇게 하는게 연산이 더 빠르다고 하셨는데요..

이유가 무엇인가요..??

답변 1

답변을 작성해보세요.

2

안녕하세요.

위의 코드는 데이터프레임을 결과로 반환 받고 다시 "상권업종중분류명"컬럼에 접근하게 됩니다. 결과적으로 데이터프레임에 두 번 접근하게 됩니다.

아래 코드는 데이터프레임에 한번 접근해서 행과 열을 한 번에 가져오게 됩니다.

그래서 아래 코드가 더 빠릅니다.