inflearn logo
강의

Course

Instructor

Probability and Statistics 101

Technical statistics

표본의 분위수 구하는 방법

Resolved

83

Daesun Kim

1 asked

0

표본의 분위수를 구하는 방법에 대한 설명이 조금 헷갈렸습니다.

데이터를 오름차순으로 정렬하고,

'α 분위수는 α * 100% 위치의 값이다'라고 하셨는데,

'위치'가 단순히 데이터의 개수로 따져서

n * α 를 가리키는 건지,

아니면 데이터 범위 안에서

{x_(n) - x_(1)} * α + x_(1) 에 가까운 값의 sub index를 찾고자 하는 건지 혼동됩니다.

python 빅데이터 확률과-통계

Answer 1

0

루비네코딩

안녕하세요!

좋은 질문 주셔서 감사합니다.

표본의 "α 분위수"는 "α * 100% 백분위수"와 같은 의미입니다.

그리고 이것은 "α * 100% 위치에서의 X값"이라고 이해할 수 있습니다.

정렬된 자료를 가지고 있다면 "위치"는 n*α에 해당하고요 (서브인덱스).

그 위치에서의 X 값이 바로 분위수 입니다. (서브인덱스는 아닙니다!)

그런데 대다수의 경우에는 n*α는 정확하게 정수가 아니고 특정 서브인덱스 i와 (i+1) 사이의 실수인데요.

보통은 X_i와 X_(i+1) 사이의 값을 "내삽 (interpolation)" 방법으로 계산해서 정확도를 조금 높일 수 있습니다.

다시 정리해 보면 "위치의 값" 대신에 "위치 에서의 X값"이라 해석해 주세요~

다소 루스한 용어 사용을 정확하게 지적해 주셔서 감사합니다^^

루비네 코딩^^

 

 

 

 

 

 

만세력 계산 오류 및 결과 오류

0

4

2

강사님.. 하단 URL에 있었던 코드들 다운 받거나 공유 부탁 드립니다..

0

4

1

작업형1 강의 수강 완료 후..

0

6

0

한글 변수의 한글 상태를 만드는 법?

0

9

0

작업형1 모의문제 4번에 3)문제 질문

0

15

2

강의 수강 순서

0

14

1

coders 사이트 로그인이 안돼요

0

22

2

호스트 테스트 주소 복사?

0

18

1

이상치 전처리 작업

0

21

2

명령팔레트에서 오류

0

33

3

평가결과값 문의

0

27

2

Sonauto V2 text to audio

0

20

2

Part2 자료에 대한 질문입니다.

0

23

2

하단 파일이 열리지 않습니다

0

33

1

ssh-keygen -t rsa -P "" 등 ssh 암호화? 는 하둡에서 필수인가요?

0

26

2

시계열 데이터 날짜와 시간 format

0

31

2

자동화 프로그램 프로젝트

0

23

1

도커 컨테이너 생성 과정 오류 질문입니다.

0

52

2

평가지표 F1 스코어 질문드립니다.

0

24

2

수업 내 사용되는 프롬프트 등 강의 자료

0

23

1

강의 일정

0

35

2

replit에서 developer frameworks가 안보여요

0

29

2

증심극한정리

1

89

2

피셔의 z변환 질문

0

498

2