• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

상관계수 관련 질문

20.08.06 22:29 작성 조회수 161

0

안녕하세요. 강의 잘 듣고 있습니다!

다름이 아니라 상관계수가 1에 가까우면 상관관계가 높고 -1에 가까우면 상관관계가 낮다, 라고 설명하셨는데요. 통계학 수업에서 큰 절대값을 가질 경우 강한 양/음의 상관관계를 갖고 있다는 의미라고 배웠어서.. 상관관계가 높다/낮다라는 표현이 올바른 건지 궁금해서 질문 남깁니다. heatmap default colour가 단일 컬러 그라데이션이 아닌 것도 같은 맥락이라고 생각했습니다. 

여러 feature가 있을 때 상관관계를 파악해 feature을 선택한다면 양의 상관관계를 갖는 데이터끼리의 분석을 우선으로 해야할까요? 저는 절대값이 0에 가까운 데이터들이 유용한 인사이트를 찾을 확률이 낮다고 생각해왔거든요. 현실에서는 음의 상관관계를 갖는 데이터끼리의 분석도 잘 진행하지 않는걸까요? 저는 예전에 주식 포트폴리오를 짜야할 때 오히려 음의 상관관계를 갖는 종목 위주로 찾기도 했었어서요.

감사합니다. :)

답변 1

답변을 작성해보세요.

0

안녕하세요. 말씀하신 부분이 맞습니다.

제가 착각한 부분이 있었습니다. +1에 가까우면, 양의 상관 관계, 0에 가까우면 상관관계가 없고, -1에 가까우면 음의 상관 관계가 있습니다. 상관관계등 통계학쪽으로 가면, 다소 복잡하기만한 측면이 있어서, 가볍게 설명한다는 마음으로 설명하다가, 제가 완전히 착각을 했네요. 제 잔재미코딩 블로그에도 제가 이렇게 적어놓았네요... --; 

관련된 부분을 모든 영상에서 편집하고, 새로 찍어서 업로드하고, 관련 자료도 업데이트하였습니다. 색상은 그렇다치더라도 다소 애매한 부분이 있어보여요. 무지개색으로 과연 어떻게 상관관계가 있냐 없냐를 확연히 볼 수 있을지는 조금 애매해서 이 부분은 다른 색상을 써보는 것이 더 좋을 것 같아서, 이 부분은 남겼습니다.

이런 경우는 처음인데... 죄송합니다.