인프런 커뮤니티 질문&답변

hnino님의 프로필 이미지
hnino

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

회귀 분석

상관계수에 대한 t 검정 관련 질문

해결된 질문

작성

·

341

0

안녕하세요, 회귀분석 강의에서 "상관계수에 대한 t검정" 부분에서 궁금한 것 있어 문의드립니다.

"상관계수에 대한 t검정"이라는 것이 상관계수를 구하고 나서 상관계수가 통계적으로 유의미한지 확인하기 위해 두 변수 사이의 상관계수가 0이 아닌지 검증하는 것이고,
- 귀무: 상관계수가 0이다
- 대립: 상관계수가 0이 아니다
이렇게 설정하는 것으로 이해했습니다.

이후, t통계량 계산하고, p-value 구하고, 어떤 가설을 채택할지 선택하는 것이구요.

 

그런데 이 과정이 꼭 필요한 것인지, 이를테면 상관계수가 높게 나왔음에도 불구하고 상관계수에 대한 t검정을 했을 때 p value가 0.05보다 커서 귀무가설을 채택하는 경우가 있을 수 있는 것인지 궁금합니다.

답변 3

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

AI가 저보다 먼저 답변을 달았네요 🙂
잘 이해하고 계신 것 같습니다.
1. 만약에 샘플 수가 작으면 상관관계가 높더라도 유의미 하지 않다라는 결론에 도달할 수 있을 것 같아요!
2. 이 과정이 꼭 필요한 것인지 -> 일반적으로는 빅데이터를 다루기 때문에 분석에서 상관 관계를 보지만 이걸 가설까지는 잘 사용하진 않는 것 같아요 그렇지만 시험을 준비하는 차원에서 문제에서 p-value값을 묻는다면 구해서 답변을 하면됩니다:)

0

hnino님의 프로필 이미지
hnino
질문자

답변 달아주신 링크 확인했으나, 가능하다면 추가적으로 답변 들을 수 있을까요?

 

0

안녕하세요, 인프런 AI 인턴입니다.

hnino님의 상관계수에 대한 T 검정 관련 질문에 대하여, 유사한 주제를 다룬 Q&A 링크를 찾아드립니다. 통계분석에서 상관계수의 통계적 유의미성을 평가하는 것은 중요한 분석 단계 중 하나입니다. 상관계수가 높다 하더라도, 해당 관계가 통계적으로 유의한지를 확인하기 위한 절차가 필요합니다. 이에 대해 상관관계 T 검정과 관련한 질문에 지식공유자께서 답변하신 내용을 참조할 수 있습니다.

  • 상관관계 T 검정시 차이에서는 상관관계 T 검정 시 나타날 수 있는 유형별 결과의 차이(피어슨/스피어맨 상관계수와 켄달타우 상관계수의 차이를 중심으로 한 설명)와 상관계수가 다르게 나올 수 있는 배경에 대해 설명합니다. 특히, 상관계수의 유의성 검정에 있어 서로 다른 결과가 나오는 상황에 대한 이해를 돕고 있습니다.

상관계수가 높게 나왔음에도 불구하고, 이러한 상관관계가 우연에 의한 결과가 아니라 실제로 유의미한지 여부를 평가하기 위해 상관계수에 대한 T 검정이 필요합니다. p값은 이러한 상관관계가 우연히 발생할 확률을 나타내며, 일반적으로 0.05 미만인 경우에 상관관계가 통계적으로 유의미하다고 판단합니다. 하지만 p값이 0.05보다 큰 경우, 우리는 귀무가설(상관계수가 0이다)을 기각하지 못하고, 두 변수 사이에 유의미한 선형 관계가 없다고 결론내릴 수 있습니다.

통계적 분석에서는 상관계수의 크기뿐만 아니라 그 상관계수가 실제로 의미있는 관계를 나타내는지 여부를 검증하는 과정이 매우 중요합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

hnino님의 프로필 이미지
hnino

작성한 질문수

질문하기