inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

대응표본검정

대응표본검정 질문

해결된 질문

53

Jin

작성한 질문수 22

0

강의 3분 32초에서 alternative는 제대로 적었다는 가정 하에 after와 before의 순서를 잘못 적으면 pvalue는 같고 검정통계량의 값만 부호가 달라진다고 말씀하셨는데, 이 부분이 이상하여 질문드립니다.

stats.ttest_rel(df['after'], df['before'], alternative='greater')

위 상황에서 after와 before를 반대로 적으면

stats.ttest_rel(df['before'], df['after'], alternative='greater')

이렇게 된다는 것일 텐데,

원래 코드(위)의 대립가설은 after가 before보다 크다는 것이고, 반대로 적은 코드(아래)의 대립가설은 before가 after보다 크다는 것이니, 두 경우가 서로 정반대를 가리켜 둘의 pvalue가 정반대의 값을 나타내야 하지 않나요?

둘의 pvalue가 같다는 건 두 경우의 대립가설이 모두 참이라는 것일 텐데 그럴 수가 없어보여서 궁금해서 질문 드립니다.

감사합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

안녕하세요:)

말씀한대로 alternative='greater'를 고정한다면 값이 반대가 나오는 것이 맞습니다.

정확하게 이해하고 계세요!

 

제가 alternative를 제대로 적었다는 가정 하에"라고 한 것은 순서를 바꿀 때 대립가설 수식에 맞게 alternative도 함께 조정했다는 의미였어요.

예를 들어,

- (after - before) > 0 → alternative='greater'

- (before - after) < 0 → alternative='less'

이렇게 순서와 alternative를 함께 바꾸면 같은 대립가설을 표현하게 되고, 그때 p-value는 같고 검정통계량의 부호만 반대가 됩니다.

 

0

인프런 AI 인턴

안녕하세요, Jin님. 인프런 AI 인턴입니다.

대응표본 t-test에서 alternative 파라미터에 따라 어떤 가설을 세우는지가 중요한 이유는 두 데이터 셋 간의 방향성을 테스트하기 위함입니다. alternative='greater' 또는 alternative='less'를 설정하면, 결과 p-value는 해당 대립가설이 얼마나 지원되는지를 평가하게 됩니다.

하지만 코드에서 보신 것처럼 데이터의 순서를 변경하면서 alternative를 잘못 설정할 경우, 방향에 대한 해석이 달라질 뿐, p-value는 양쪽 대립가설에 대해 동일한 수준의 통계적 유의성을 나타낼 수 있습니다. 즉, p-value 자체는 데이터의 일관된 차이에 기반하여 계산되므로 기본 값은 변하지 않습니다. 그러나 해석은 대립가설의 방향에 따라 달라집니다.

결론적으로, after와 before의 순서를 반대로 설정할 경우, 검정통계량의 부호는 달라질 수 있으나, p-value는 동일하게 나타날 수 있으며, 그 이후의 해석이 중요합니다. 여기에 대한 자세한 내용을 원하시면 아래 유사한 답변들이 도움이 될 수 있습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

pd.get_dummies()가 bool로 반환

0

5

1

대응표본검정 레빈

0

15

2

단일표본검정 문제 유형

0

16

2

[작업형 3] 6~7. 카이제곱 검정

0

15

2

9회 작업형3 문제 1-1

0

20

2

최종답안 계산 방식 질문

0

15

1

시험 치기 전 급하게 질문 사항

0

25

2

유형3

0

24

2

작업형 2 연습문제 섹션 3

0

18

2

11 기출문제 ipynb파일

0

21

2

작업형 3 유형

0

22

2

11회 기출 유형(작업형1) 2번 정답

0

18

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

16

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

21

2

28:19 roc_auc이유

0

20

2

수강연장문의

0

23

2

전체적인 머신러닝 순서

0

25

2

빅분기 실기 유형2질문

0

26

1

ID 전처리 이유

0

33

2

데이터제공

0

33

2

예시문제 작업형3 꼬리질문2번

0

22

1

데이터 개수를 구할 때, len과 value_counts 차이

0

29

2

작업형 2 제출방

0

22

2