해결된 질문
작성
·
128
0
안녕하세요 선생님 작업형 1문제 풀다가 헷갈리는 부분이 있어서 질문 드립니다.
상위, 하위 데이터를 구할 때 1번처럼 '='기호를 써서 포함을 시켜야 하나요 안 시켜야 하나요??
# 하위 25% 데이터
1 . df[df['가격'] <= df['가격'].quantile(.25)]
2 . df[df['가격'] < df['가격'].quantile(.25)]
# 상위 25% 데이터
1 . df[df['가격'] >= df['가격'].quantile(.75)]
2 . df[df['가격'] > df['가격'].quantile(.75)]
문제에서 1행부터 400행 값을 구하라고 할 때 저는 0행이 있으니까 2번처럼 [1:401]으로 생각했는데 [:400]이 맞다고 하더라고요 어떤게 맞는건가요??
1. df[:400]
2. df[1:401]
답변 1
0
하위 25%일때 경계값을 포함하는 것이 일반적이나 문제의 요구사항을 정확히 확인할 필요는 있을 것 같아요!
0행은 없습니다. 1행입니다. 인덱스번호가 0부터 시작합니다. 그러므로, "1행부터 400행"을 선택하려면 실제로는 인덱스 0부터 399까지를 선택해야 합니다. df[:400]을 사용합니다.
감사합니다 선생님!!