• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

df[cond][Reached.on.Time_Y.N]의 의미가 궁금합니다.

24.03.26 14:44 작성 24.03.26 14:48 수정 조회수 72

0

감사합니다.

cond 조건이 나오고 , 뒤에 또 [] 구문이 나오면 어떻게 연결되는지 궁금합니다.

 

일단 의도는 디스카운트 10% 넘는 행 중에서, 정시 도착 하는 수라고 이해했는데요.

이 두개의 []가 어떤 순서로, 이루어 지는지?

이건 두개의 명령문을 합쳐 놓은건지요?

 

 

 

답변 1

답변을 작성해보세요.

0

이해하신 대로 df[cond][Reached.on.Time_Y.N]는 두 개의 대괄호 [] 명령문을 연결해서 사용한 것입니다.


처음 df[cond]는 cond 조건에 해당하는 행(row)들만 필터링해서 선택하는 역할을 합니다.
그 다음 df[cond] 뒤에 오는 [Reached.on.Time_Y.N]는 앞서 선택된 행들 중에서 Reached.on.Time_Y.N 컬럼의 값만 추출하는 역할을 합니다.


즉, df[cond][Reached.on.Time_Y.N]는 아래와 같이 두 단계로 이뤄진다고 보시면 됩니다.

  1. df[cond] : Discount > 10% 조건을 만족하는 행 선택

  2. df[cond][Reached.on.Time_Y.N] : 1에서 선택된 행들의 Reached.on.Time_Y.N 컬럼값 선택

    이렇게 대괄호를 연속으로 사용하는 체이닝(chaining) 방식은 판다스에서 자주 쓰이는 문법입니다. 코드를 간결하게 만들어주는 장점이 있어요.