inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[13/20] scatterplot, regplot, lmplot, swarmplot 의 차이를 분양가 데이터 시각화로 이해하기

swarmplot 진행 시 경고문

436

안병준

작성한 질문수 3

2

안녕하세요. 

우선 양질의 강의 감사합니다.

swarmplot 그리는 중에

다음과 같은 경고가 뜨는데 원인이 무엇인가요?

C:\Anaconda\lib\site-packages\seaborn\categorical.py:1326: RuntimeWarning: invalid value encountered in less
  off_low = points < low_gutter
C:\Anaconda\lib\site-packages\seaborn\categorical.py:1330: RuntimeWarning: invalid value encountered in greater
  off_high = points > high_gutter

python numpy pandas

답변 5

1

박조은

안녕하세요. 

seaborn 은 여러 라이브러리를 섞어서 고수준의 인터페이스를 제공하는 라이브러리에요.

이런 라이브러리들의 특징이 사용하기는 쉽지만 내부에서는 여러 라이브러리를 사용하고 있기 때문에 버전 업데이트 등의 문제가 종종 발생하는 편이에요.

이런 버전을 맞추는 작업이 분석하는 과정보다 까다롭고 어려운 편이에요 ㅜㅜ

이런 버전을 맞추다 보면 정작 하고자 하는 분석을 하는데 써야할 시간과 노력을 다 써버릴 수 있으니 경고메시지는 나중에 보셔도 괜찮을거 같아요.

감사합니다.

1

안병준

링크해주신 코드를 봐도 잘 이해가 되지는 않습니다만ㅜㅜ, 이해하려고 해보며
우선 강의 따라가 보도록 하겠습니다. 감사합니다.

1

박조은

안녕하세요.

보통 오류메시지와 경고메시지가 있는데 오류메시지는 코드가 아예 표시가 되지 않기 때문에 꼭 고쳐주셔야 해요.

경고메시지는 여러 이유로 발생하게 되는데요.

경고메시지는 무시해도 괜찮지만 여기에서 왜 경고메시지가 났을지 seaborn 의 소스코드를 찾아봤어요.

특정 값이 잘못되었거나 여러 라이브러리를 사용하면서 적절한 파라메터 값이 전달되지 않아서 발생할 수도 있는데 여기서 발생한 오류메시지가 아래와 같은 비교 연산을 하는데 적절한 데이터 타입이 들어가지 않은것 같아요.

 off_low = points < low_gutter

데이터프레임의 데이터를 확인해 봐야지 좀 더 자세히 알 수 있을거 같지만 아마도 결측치 혹은 계산이 불가한 데이터 타입이 섞여 있지 않을까 싶어요.

참고삼아 해당 소스코드를 다음의 URL 에서 확인해 보실 수 있어요.

https://github.com/mwaskom/seaborn/blob/a4a95425dd784b7d027fa92443f20b541fef96d5/seaborn/categorical.py#L1278

seaborn 은 내부적으로 matplotlib, pandas, numpy 등의 파이썬 라이브러리를 사용하는데 버전의 차이 등으로 저는 경고메시지가 발생하지 않았지만 저와 다른 버전을 사용하고 있다면 이런 경고 메시지가 발생할 수도 있어요.

그럼 저와 같은 버전을 사용하면 경고메시지가 안 나올 수도 있겠지만 해당 경고메시지 출력을 줄이기 위해 버전을 맞추는 일이 더 어려울수도 있고 소프트웨어의 버전은 계속 업데이트 되기 때문에 어떤 이유로 경고메시지가 발생하는지 정도를 알아두시는걸 더 추천해요.

1

안병준

선생님 답변속도가 ㅎㄷㄷ하시네요..

0

박조은

안녕하세요!

오류메시지만으로는 어디에서 오류가 났는지 확인이 어려워서요.

작성하신 코드와 또 코드에 사용한 데이터프레임의 스크린샷을 올려주시면 도움을 드릴 수 있을거 같아요.

감사합니다.

패키지 설치 에러 ydata-profiling

0

121

2

자세한 설명 부탁드려요 ㅜ

0

177

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

288

2

value_counts와 count 차이

0

343

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

205

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

309

2

시각화 라이브러리 비교

0

383

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

213

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

478

1

corr = df.corr() 입력시 오류

1

373

1

keyword grid_b is not recognized

0

336

1

%ls data 매직커맨드 사용시 한글 깨짐

0

293

1