표본의 분위수 구하는 방법
표본의 분위수를 구하는 방법에 대한 설명이 조금 헷갈렸습니다.
데이터를 오름차순으로 정렬하고,
'α 분위수는 α * 100% 위치의 값이다'라고 하셨는데,
'위치'가 단순히 데이터의 개수로 따져서
n * α 를 가리키는 건지,
아니면 데이터 범위 안에서
{x_(n) - x_(1)} * α + x_(1) 에 가까운 값의 sub index를 찾고자 하는 건지 혼동됩니다.
Answer 1
0
안녕하세요!
좋은 질문 주셔서 감사합니다.
표본의 "α 분위수"는 "α * 100% 백분위수"와 같은 의미입니다.
그리고 이것은 "α * 100% 위치에서의 X값"이라고 이해할 수 있습니다.
정렬된 자료를 가지고 있다면 "위치"는 n*α에 해당하고요 (서브인덱스).
그 위치에서의 X 값이 바로 분위수 입니다. (서브인덱스는 아닙니다!)
그런데 대다수의 경우에는 n*α는 정확하게 정수가 아니고 특정 서브인덱스 i와 (i+1) 사이의 실수인데요.
보통은 X_i와 X_(i+1) 사이의 값을 "내삽 (interpolation)" 방법으로 계산해서 정확도를 조금 높일 수 있습니다.
다시 정리해 보면 "위치의 값" 대신에 "위치 에서의 X값"이라 해석해 주세요~
다소 루스한 용어 사용을 정확하게 지적해 주셔서 감사합니다^^
루비네 코딩^^
구글 그래피티 마켓 오류...?!
0
7
2
디스코드 소통창구는 없어졌나요 ??
0
7
1
FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.
0
5
1
모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!
0
7
1
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
5
1
20번강좌에 대한 질문입니다.
0
6
1
강사님 안녕하세요 ㅎdatabricks환경에 대한 설
0
6
1
6-6
0
18
1
작업형 1 유형 부분
0
17
2
수강평 이벤트
0
23
2
작업형 1 (삭제예정, 구 버전)
0
34
2
강의노트는 어디있나요?
0
21
1
노션 학습 자료 권한 요청
0
17
1
수강기간 연장 문의드립니다.
0
26
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
25
3
part2강의 문의사항입니다.
0
23
2
수강기간 연장 문의드립니다.
0
28
1
인덱스 슬라이싱
0
28
2
코드를 첨부해야하는 이유가 있나요?
0
22
2
소리가 겹쳐서 들려요
0
23
2
데스크톱과 노트북 연결
0
30
1
맥북 환경구성 에러
0
19
2
증심극한정리
1
87
2
피셔의 z변환 질문
0
494
2

