작업형3 연습문제 단일 표본 검정 질문

Question

제가 시험환경에서 돌려보았습니다 #1 표본데이터의 평균을 구하시오Caffeine(mg) print(df['Caffeine(mg)'].mean()) #2 샤피로 검정 0.9322031137746971 print(stats.shapiro(df['Caffeine(mg)'])) #단일표본t검정의 검정통계량과-5.501737036221897 pvalue print(stats.ttest_1samp(df['Caffeine(mg)'],95,alternative='less')) samp=stats.ttest_1samp(df['Caffeine(mg)'],95,alternative='less') print(samp.pvalue) print(format(5.8686553916715e-06,'.10f')) 결과 ShapiroResult(statistic=0.9826578166170536, pvalue=0.9322031137746971) TtestResult(statistic=-5.501737036221897, pvalue=5.8686553916715e-06, df=24) 5.8686553916715e-06 0.0000058687 ####질문 만약 문제에서 p_value값을 물어보았고 반올림하여라 그런말 없이 물어본다면 지수표기법을 바꿔서 적어야할텐데. 일반표기법을 어디까지 적어야할지요?ㅠㅠ

퇴근후딴짓 · Answer

보통 아무리 깊어도 소수 3~4번째 자리까지 입니다. 지수표기법 기준 -06은 시험 상황에서는 만들진 않을 것 같아요! 일반표기법으로 변경 방법 판다스 pd.set_option('display.float_format', '{:.10f}'.format) 파이썬 x = 1.23e6 print(format(x, 'f'))

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. 문정현님. 현재 작업형3 연습문제를 진행하면서 단일 표본 t-검정의 결과로 도출된 p-value에 대한 표기 방식에 대한 질문을 주셨네요. 통계 분석을 수행할 때, p-value의 표기는 매우 중요하며, 작성 방식에 따라 해석이 달라질 수 있습니다. 질문의 핵심은 p-value를 일반 표기법으로 얼마까지 적어야 되느냐에 대한 것입니다. 지수 표기법 vs 일반 표기법 : 일반 표기법 은 보통 소수점 이하 네 자리 수까지 표기하는 것이 일반적입니다. 예를 들어 0.0000058687 를 소수점 이하에서 네 자리까지 0.0000 로 표기하게 되면 손실된 정보가 많기 때문에, 0.05 이하와 같은 유의미한 p-value의 경우는 지수 표기법(예: 5.87e-06) 으로 작성함으로써 읽기 쉽고 정확한 정보를 제공할 수 있습니다. 여기서 질문에 &lsquo;반올림이 없으면 어떻게 적어야 되는가?&lsquo;에 대한 답은, 일반적 으로 지수 표기법을 사용하지 않는다면 소수점 네 자리 까지 표시하는 것이 좋습니다. 그러나 문맥에 따라 지수 표기법을 수용하는 경우도 많습니다. p-value Reporting : 통상적으로 통계 보고서에서는 p-value 표기를 아주 작은 값일 때는 p < 0.001 로 나타냅니다. 이 방식은 너무 작은 p-value를 읽기 쉽게 제공합니다. 시험 문제나 지시에 구체적 표기에 대한 요구 사항이 없었다면, 보편적인 표기 기준에 준하여 읽는 사람이 명확히 인식할 수 있도록 소수점 네 자리 수 까지 표시하는 것이 일반적이며 권장됩니다. 참고 링크를 통해 관련 내용을 더 확인하시고 다양한 예제들을 검토해보시는 것도 좋답니다. 샤피로 검정을 통한 정규성 검정 이해하기 단일 표본 t-검정의 통계량과 p-value 계산 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.