표본의 분위수 구하는 방법
표본의 분위수를 구하는 방법에 대한 설명이 조금 헷갈렸습니다.
데이터를 오름차순으로 정렬하고,
'α 분위수는 α * 100% 위치의 값이다'라고 하셨는데,
'위치'가 단순히 데이터의 개수로 따져서
n * α 를 가리키는 건지,
아니면 데이터 범위 안에서
{x_(n) - x_(1)} * α + x_(1) 에 가까운 값의 sub index를 찾고자 하는 건지 혼동됩니다.
Answer 1
0
안녕하세요!
좋은 질문 주셔서 감사합니다.
표본의 "α 분위수"는 "α * 100% 백분위수"와 같은 의미입니다.
그리고 이것은 "α * 100% 위치에서의 X값"이라고 이해할 수 있습니다.
정렬된 자료를 가지고 있다면 "위치"는 n*α에 해당하고요 (서브인덱스).
그 위치에서의 X 값이 바로 분위수 입니다. (서브인덱스는 아닙니다!)
그런데 대다수의 경우에는 n*α는 정확하게 정수가 아니고 특정 서브인덱스 i와 (i+1) 사이의 실수인데요.
보통은 X_i와 X_(i+1) 사이의 값을 "내삽 (interpolation)" 방법으로 계산해서 정확도를 조금 높일 수 있습니다.
다시 정리해 보면 "위치의 값" 대신에 "위치 에서의 X값"이라 해석해 주세요~
다소 루스한 용어 사용을 정확하게 지적해 주셔서 감사합니다^^
루비네 코딩^^
대응표본검정 레빈
0
7
2
단일표본검정 문제 유형
0
10
2
[작업형 3] 6~7. 카이제곱 검정
0
11
2
시스템 아키텍처를 강의에 나온 것 처럼 그리고 싶은데 공유 가능할까요?
1
10
2
9회 작업형3 문제 1-1
0
16
2
최종답안 계산 방식 질문
0
13
1
PROJECT_STRUCTURE.md 파일 공유좀 해주세요
0
13
2
맥북에서 아이패드로 연결해서 보려고 하면 화면이 안뜹니다.
0
2
1
시험 치기 전 급하게 질문 사항
0
21
2
노션 사용권한 불편합니다.
0
11
2
유형3
0
19
2
작업형 2 연습문제 섹션 3
0
13
2
dags_email_on_failure
0
8
1
11 기출문제 ipynb파일
0
18
2
작업형 3 유형
0
18
2
session이 점점 길어지면 어떻게 대처하나요?
1
15
1
11회 기출 유형(작업형1) 2번 정답
0
17
2
f1 score 질문
0
18
2
10회 작업형 2 인코딩 질의
0
14
2
자동화프롬프트 가져오기 에러
0
12
1
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
20
2
28:19 roc_auc이유
0
18
2
증심극한정리
1
108
2
피셔의 z변환 질문
0
523
2

