-
카테고리
-
세부 분야
자격증 (데이터 사이언스)
-
해결 여부
해결됨
질문 있습니다!!
23.11.02 20:31 작성 조회수 64
0
안녕하세요 선생님 작업형 1문제 풀다가 헷갈리는 부분이 있어서 질문 드립니다.
상위, 하위 데이터를 구할 때 1번처럼 '='기호를 써서 포함을 시켜야 하나요 안 시켜야 하나요??
# 하위 25% 데이터
1 . df[df['가격'] <= df['가격'].quantile(.25)]
2 . df[df['가격'] < df['가격'].quantile(.25)]
# 상위 25% 데이터
1 . df[df['가격'] >= df['가격'].quantile(.75)]
2 . df[df['가격'] > df['가격'].quantile(.75)]
문제에서 1행부터 400행 값을 구하라고 할 때 저는 0행이 있으니까 2번처럼 [1:401]으로 생각했는데 [:400]이 맞다고 하더라고요 어떤게 맞는건가요??
1. df[:400] 2. df[1:401]
답변을 작성해보세요.
0
퇴근후딴짓
지식공유자2023.11.02
하위 25%일때 경계값을 포함하는 것이 일반적이나 문제의 요구사항을 정확히 확인할 필요는 있을 것 같아요!
0행은 없습니다. 1행입니다. 인덱스번호가 0부터 시작합니다. 그러므로, "1행부터 400행"을 선택하려면 실제로는 인덱스 0부터 399까지를 선택해야 합니다. df[:400]을 사용합니다.
답변 1