inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Xác suất và Thống kê 101

thống kê mô tả

표본의 분위수 구하는 방법

Đã giải quyết

100

Daesun Kim

1 câu hỏi đã được viết

0

표본의 분위수를 구하는 방법에 대한 설명이 조금 헷갈렸습니다.

데이터를 오름차순으로 정렬하고,

'α 분위수는 α * 100% 위치의 값이다'라고 하셨는데,

'위치'가 단순히 데이터의 개수로 따져서

n * α 를 가리키는 건지,

아니면 데이터 범위 안에서

{x_(n) - x_(1)} * α + x_(1) 에 가까운 값의 sub index를 찾고자 하는 건지 혼동됩니다.

python 빅데이터 확률과-통계

Câu trả lời 1

0

루비네코딩

안녕하세요!

좋은 질문 주셔서 감사합니다.

표본의 "α 분위수"는 "α * 100% 백분위수"와 같은 의미입니다.

그리고 이것은 "α * 100% 위치에서의 X값"이라고 이해할 수 있습니다.

정렬된 자료를 가지고 있다면 "위치"는 n*α에 해당하고요 (서브인덱스).

그 위치에서의 X 값이 바로 분위수 입니다. (서브인덱스는 아닙니다!)

그런데 대다수의 경우에는 n*α는 정확하게 정수가 아니고 특정 서브인덱스 i와 (i+1) 사이의 실수인데요.

보통은 X_i와 X_(i+1) 사이의 값을 "내삽 (interpolation)" 방법으로 계산해서 정확도를 조금 높일 수 있습니다.

다시 정리해 보면 "위치의 값" 대신에 "위치 에서의 X값"이라 해석해 주세요~

다소 루스한 용어 사용을 정확하게 지적해 주셔서 감사합니다^^

루비네 코딩^^

 

 

 

 

 

 

기출 11회 작업형 2_전체 데이터 학습 여부

0

8

1

RateLimitError

0

7

2

예측값 결과 소수점 차이

0

15

2

여태까지 발견한 이슈들 공유드립니다.

1

14

1

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

13

0

전처리 train() test([ ])

0

13

2

작업형 1 배경지식 질문

0

16

2

옳게 풀은건지 질문드립니다!

0

12

1

roc_auc_score

0

22

2

재귀함수 연산법

0

11

2

추가질문 합니다

0

13

2

시험환경 구름

0

16

2

변경된 체험환경 작업형3번질문이요

0

8

2

2유형 질문드려요

0

13

2

RandomForest vs lgb

0

22

2

전처리 관련질문

0

21

3

수강기간즘연장해주세요

0

11

1

작업형3 기출

0

15

2

유형2에서 데이터분할 생략 가능여부

0

27

2

9회 기출 유형3 질문

0

16

2

lgb 기초편

0

12

1

수업자료 문의

0

17

2

증심극한정리

1

108

2

피셔의 z변환 질문

0

526

2