inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

상관계수 관련 질문

282

Seoyoung

작성한 질문수 1

0

안녕하세요. 강의 잘 듣고 있습니다!

다름이 아니라 상관계수가 1에 가까우면 상관관계가 높고 -1에 가까우면 상관관계가 낮다, 라고 설명하셨는데요. 통계학 수업에서 큰 절대값을 가질 경우 강한 양/음의 상관관계를 갖고 있다는 의미라고 배웠어서.. 상관관계가 높다/낮다라는 표현이 올바른 건지 궁금해서 질문 남깁니다. heatmap default colour가 단일 컬러 그라데이션이 아닌 것도 같은 맥락이라고 생각했습니다. 

여러 feature가 있을 때 상관관계를 파악해 feature을 선택한다면 양의 상관관계를 갖는 데이터끼리의 분석을 우선으로 해야할까요? 저는 절대값이 0에 가까운 데이터들이 유용한 인사이트를 찾을 확률이 낮다고 생각해왔거든요. 현실에서는 음의 상관관계를 갖는 데이터끼리의 분석도 잘 진행하지 않는걸까요? 저는 예전에 주식 포트폴리오를 짜야할 때 오히려 음의 상관관계를 갖는 종목 위주로 찾기도 했었어서요.

감사합니다. :)

pandas python

답변 1

0

잔재미코딩 DaveLee

안녕하세요. 말씀하신 부분이 맞습니다.

제가 착각한 부분이 있었습니다. +1에 가까우면, 양의 상관 관계, 0에 가까우면 상관관계가 없고, -1에 가까우면 음의 상관 관계가 있습니다. 상관관계등 통계학쪽으로 가면, 다소 복잡하기만한 측면이 있어서, 가볍게 설명한다는 마음으로 설명하다가, 제가 완전히 착각을 했네요. 제 잔재미코딩 블로그에도 제가 이렇게 적어놓았네요... --; 

관련된 부분을 모든 영상에서 편집하고, 새로 찍어서 업로드하고, 관련 자료도 업데이트하였습니다. 색상은 그렇다치더라도 다소 애매한 부분이 있어보여요. 무지개색으로 과연 어떻게 상관관계가 있냐 없냐를 확연히 볼 수 있을지는 조금 애매해서 이 부분은 다른 색상을 써보는 것이 더 좋을 것 같아서, 이 부분은 남겼습니다.

이런 경우는 처음인데... 죄송합니다.

Python 3 표시 없습니다.

0

54

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

66

1

구글 코랩과 아나콘다

0

80

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

96

1

COVID-19-master 관련 등 자료 누락

0

82

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

95

1

json.dumps관련된 질문

0

71

1

빅분기대비

0

112

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

93

1

강의자료 어디서 다운로드받나요?

0

138

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

98

1

iplot 에러 문제

1

200

1

플래그

0

75

1

플래그 라이브러리

0

83

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

179

1

CSV 파일 읽을 때 오류

0

191

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

136

1

강의 교재 및 실습 파일 제공되나요?

0

180

1

deep_data_and_visual 파일에서 에러가 납니다.

0

181

1

apply()함수

0

200

1

pandas groupby sum 질문

1

271

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

350

2

pandas_eda 힛맵에서 숫자가 안떠요

0

254

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

276

1