표본의 분위수 구하는 방법
표본의 분위수를 구하는 방법에 대한 설명이 조금 헷갈렸습니다.
데이터를 오름차순으로 정렬하고,
'α 분위수는 α * 100% 위치의 값이다'라고 하셨는데,
'위치'가 단순히 데이터의 개수로 따져서
n * α 를 가리키는 건지,
아니면 데이터 범위 안에서
{x_(n) - x_(1)} * α + x_(1) 에 가까운 값의 sub index를 찾고자 하는 건지 혼동됩니다.
답변 1
0
안녕하세요!
좋은 질문 주셔서 감사합니다.
표본의 "α 분위수"는 "α * 100% 백분위수"와 같은 의미입니다.
그리고 이것은 "α * 100% 위치에서의 X값"이라고 이해할 수 있습니다.
정렬된 자료를 가지고 있다면 "위치"는 n*α에 해당하고요 (서브인덱스).
그 위치에서의 X 값이 바로 분위수 입니다. (서브인덱스는 아닙니다!)
그런데 대다수의 경우에는 n*α는 정확하게 정수가 아니고 특정 서브인덱스 i와 (i+1) 사이의 실수인데요.
보통은 X_i와 X_(i+1) 사이의 값을 "내삽 (interpolation)" 방법으로 계산해서 정확도를 조금 높일 수 있습니다.
다시 정리해 보면 "위치의 값" 대신에 "위치 에서의 X값"이라 해석해 주세요~
다소 루스한 용어 사용을 정확하게 지적해 주셔서 감사합니다^^
루비네 코딩^^
로그프레소 강의 버전관련 문의
0
0
0
26,27강 진행 간 노션, html 프롬프트 파일 불일치
0
5
1
강의 자료
0
12
1
27:15 break 출력
0
11
1
kaggle notebook에 service key 설정이 누락된 것 같습니다
1
17
2
수업 노트가 안 보입니다.
0
21
1
Python formatter 설치
0
16
1
55강 파이썬에만있는 연산자들
0
24
2
55강의 파이썬에서만 있는 연산자들
0
20
2
주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성
1
29
1
naver 글자 수집 오류 건
0
23
1
쥬피터 노트북이 실행이 안됩니다.
0
25
1
뒤로가기 버튼 같은 것이 있나요?
0
27
1
Replit 강의 자료가 안나와요
0
20
1
강의 연장 문의
0
31
1
프로그램 실행시간에 대한 질문
1
23
2
비중 및 매수 종목수 조정.
1
32
2
Claude api가 소식 동기화가 늦는 문제
1
41
2
[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요
0
26
1
codex에게 대용량 코드베이스를 인식 시키는 방법은 어떤게 있나요?
0
34
1
출력값 질문
0
31
2
슬롯 관련 문의
1
30
2
증심극한정리
1
110
2
피셔의 z변환 질문
0
529
2





