• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

질문 있습니다!!

23.11.02 20:31 작성 조회수 64

0

안녕하세요 선생님 작업형 1문제 풀다가 헷갈리는 부분이 있어서 질문 드립니다.

  1. 상위, 하위 데이터를 구할 때 1번처럼 '='기호를 써서 포함을 시켜야 하나요 안 시켜야 하나요??

# 하위 25% 데이터
1 . df[df['가격'] <= df['가격'].quantile(.25)]
2 . df[df['가격'] < df['가격'].quantile(.25)]

# 상위 25% 데이터
1 . df[df['가격'] >= df['가격'].quantile(.75)]
2 . df[df['가격'] > df['가격'].quantile(.75)]
  1. 문제에서 1행부터 400행 값을 구하라고 할 때 저는 0행이 있으니까 2번처럼 [1:401]으로 생각했는데 [:400]이 맞다고 하더라고요 어떤게 맞는건가요??

    1. df[:400]
    2. df[1:401]

답변 1

답변을 작성해보세요.

0

  1. 하위 25%일때 경계값을 포함하는 것이 일반적이나 문제의 요구사항을 정확히 확인할 필요는 있을 것 같아요!

  1. 0행은 없습니다. 1행입니다. 인덱스번호가 0부터 시작합니다. 그러므로, "1행부터 400행"을 선택하려면 실제로는 인덱스 0부터 399까지를 선택해야 합니다. df[:400]을 사용합니다.

김석종님의 프로필

김석종

질문자

2023.11.03

감사합니다 선생님!!