작업형3 연습문제 단일 표본 검정 질문
제가 시험환경에서 돌려보았습니다

#1 표본데이터의 평균을 구하시오Caffeine(mg)
print(df['Caffeine(mg)'].mean())
#2 샤피로 검정 0.9322031137746971
print(stats.shapiro(df['Caffeine(mg)']))
#단일표본t검정의 검정통계량과-5.501737036221897 pvalue
print(stats.ttest_1samp(df['Caffeine(mg)'],95,alternative='less'))
samp=stats.ttest_1samp(df['Caffeine(mg)'],95,alternative='less')
print(samp.pvalue)
print(format(5.8686553916715e-06,'.10f'))
결과
ShapiroResult(statistic=0.9826578166170536, pvalue=0.9322031137746971)
TtestResult(statistic=-5.501737036221897, pvalue=5.8686553916715e-06, df=24)
5.8686553916715e-06
0.0000058687
####질문 만약 문제에서 p_value값을 물어보았고 반올림하여라 그런말 없이 물어본다면 지수표기법을 바꿔서 적어야할텐데. 일반표기법을 어디까지 적어야할지요?ㅠㅠ
답변 2
0
보통 아무리 깊어도 소수 3~4번째 자리까지 입니다.
지수표기법 기준 -06은 시험 상황에서는 만들진 않을 것 같아요!
일반표기법으로 변경 방법
판다스
pd.set_option('display.float_format', '{:.10f}'.format)
파이썬
x = 1.23e6
print(format(x, 'f'))
0
안녕하세요, 인프런 AI 인턴입니다. 문정현님.
현재 작업형3 연습문제를 진행하면서 단일 표본 t-검정의 결과로 도출된 p-value에 대한 표기 방식에 대한 질문을 주셨네요. 통계 분석을 수행할 때, p-value의 표기는 매우 중요하며, 작성 방식에 따라 해석이 달라질 수 있습니다. 질문의 핵심은 p-value를 일반 표기법으로 얼마까지 적어야 되느냐에 대한 것입니다.
지수 표기법 vs 일반 표기법:
일반 표기법은 보통 소수점 이하 네 자리 수까지 표기하는 것이 일반적입니다. 예를 들어0.0000058687를 소수점 이하에서 네 자리까지0.0000로 표기하게 되면 손실된 정보가 많기 때문에, 0.05 이하와 같은 유의미한 p-value의 경우는지수 표기법(예: 5.87e-06)으로 작성함으로써 읽기 쉽고 정확한 정보를 제공할 수 있습니다.
- 여기서 질문에 ‘반올림이 없으면 어떻게 적어야 되는가?‘에 대한 답은, 일반적으로 지수 표기법을 사용하지 않는다면
소수점 네 자리까지 표시하는 것이 좋습니다. 그러나 문맥에 따라 지수 표기법을 수용하는 경우도 많습니다.
p-value Reporting:
- 통상적으로 통계 보고서에서는 p-value 표기를 아주 작은 값일 때는
p < 0.001로 나타냅니다. 이 방식은 너무 작은 p-value를 읽기 쉽게 제공합니다.
- 시험 문제나 지시에 구체적 표기에 대한 요구 사항이 없었다면, 보편적인 표기 기준에 준하여 읽는 사람이 명확히 인식할 수 있도록
소수점 네 자리 수까지 표시하는 것이 일반적이며 권장됩니다.
- 통상적으로 통계 보고서에서는 p-value 표기를 아주 작은 값일 때는
참고 링크를 통해 관련 내용을 더 확인하시고 다양한 예제들을 검토해보시는 것도 좋답니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
11회 기출 유형(작업형1) 2번 정답
0
7
1
f1 score 질문
0
6
1
10회 작업형 2 인코딩 질의
0
6
1
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
10
2
28:19 roc_auc이유
0
15
2
수강연장문의
0
15
2
전체적인 머신러닝 순서
0
10
1
빅분기 실기 유형2질문
0
15
1
ID 전처리 이유
0
28
2
데이터제공
0
23
2
예시문제 작업형3 꼬리질문2번
0
15
1
데이터 개수를 구할 때, len과 value_counts 차이
0
19
2
작업형 2 제출방
0
19
2
인코딩 스케일링 순서
0
20
2
실제 시험에서도 공식을 문제에서 주는지
0
20
2
수강 연장 문의
0
17
2
작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ
0
21
1
14강 "" 사용 관련 질문
0
22
2
캐글 제출 점수
0
26
2
기출 마무리 방법
0
50
2
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
33
6
데이터프레임 슬라이싱 인덱싱 질문2
0
29
2
단일표본검정, 샤피로검정, 윌콕슨검정
0
38
2
강의자료 다운로드 여부
0
39
2





