강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

Jin님의 프로필 이미지
Jin

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

대응표본검정

대응표본검정 질문

해결된 질문

작성

·

32

0

강의 3분 32초에서 alternative는 제대로 적었다는 가정 하에 after와 before의 순서를 잘못 적으면 pvalue는 같고 검정통계량의 값만 부호가 달라진다고 말씀하셨는데, 이 부분이 이상하여 질문드립니다.

stats.ttest_rel(df['after'], df['before'], alternative='greater')

위 상황에서 after와 before를 반대로 적으면

stats.ttest_rel(df['before'], df['after'], alternative='greater')

이렇게 된다는 것일 텐데,

원래 코드(위)의 대립가설은 after가 before보다 크다는 것이고, 반대로 적은 코드(아래)의 대립가설은 before가 after보다 크다는 것이니, 두 경우가 서로 정반대를 가리켜 둘의 pvalue가 정반대의 값을 나타내야 하지 않나요?

둘의 pvalue가 같다는 건 두 경우의 대립가설이 모두 참이라는 것일 텐데 그럴 수가 없어보여서 궁금해서 질문 드립니다.

감사합니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

안녕하세요:)

말씀한대로 alternative='greater'를 고정한다면 값이 반대가 나오는 것이 맞습니다.

정확하게 이해하고 계세요!

 

제가 alternative를 제대로 적었다는 가정 하에"라고 한 것은 순서를 바꿀 때 대립가설 수식에 맞게 alternative도 함께 조정했다는 의미였어요.

예를 들어,

- (after - before) > 0 → alternative='greater'

- (before - after) < 0 → alternative='less'

이렇게 순서와 alternative를 함께 바꾸면 같은 대립가설을 표현하게 되고, 그때 p-value는 같고 검정통계량의 부호만 반대가 됩니다.

 

0

안녕하세요, Jin님. 인프런 AI 인턴입니다.

대응표본 t-test에서 alternative 파라미터에 따라 어떤 가설을 세우는지가 중요한 이유는 두 데이터 셋 간의 방향성을 테스트하기 위함입니다. alternative='greater' 또는 alternative='less'를 설정하면, 결과 p-value는 해당 대립가설이 얼마나 지원되는지를 평가하게 됩니다.

하지만 코드에서 보신 것처럼 데이터의 순서를 변경하면서 alternative를 잘못 설정할 경우, 방향에 대한 해석이 달라질 뿐, p-value는 양쪽 대립가설에 대해 동일한 수준의 통계적 유의성을 나타낼 수 있습니다. 즉, p-value 자체는 데이터의 일관된 차이에 기반하여 계산되므로 기본 값은 변하지 않습니다. 그러나 해석은 대립가설의 방향에 따라 달라집니다.

결론적으로, after와 before의 순서를 반대로 설정할 경우, 검정통계량의 부호는 달라질 수 있으나, p-value는 동일하게 나타날 수 있으며, 그 이후의 해석이 중요합니다. 여기에 대한 자세한 내용을 원하시면 아래 유사한 답변들이 도움이 될 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Jin님의 프로필 이미지
Jin

작성한 질문수

질문하기