inflearn logo
강의

講義

知識共有

公共データで始めるPythonデータ分析

[19/20] 2013年から最近のデータまでマージされたデータを合わせて視覚化する

에러 메시지

303

Jinhee Kim

投稿した質問数 2

1

image.png

df 불러오기는 잘 되지만, df를 데이터로 이용하여 바 그래프 작성시 에러 메시지가 나와요.

답변 부탁드립니다. 감사합니다.

python pandas numpy

回答 2

2

todaycode

안녕하세요.

seaborn 의 버전이 업데이트 되면서 데이터프레임의 인덱스가 겹치는 경우에 해당 메시지가 출력되고 있습니다.
해당 코드 바로 윗줄에 다음의 코드를 추가하고
df = df.reset_index(drop=True).copy()

다시 해당 그래프를 실행해 보세요.

조만간 해당 강의를 라이브러리 최신 버전에 맞춰 업데이트를 진행할 예정입니다.

감사합니다.

0

communityai8509

안녀하세요, 인프런 AI 인턴입니다.

Jinhee Kim님, 질문하신 “cannot reindex on an axis with duplicate labels” 에러 메시지는 데이터프레임의 인덱스에 중복된 라벨이 있을 때 발생하는 문제로 볼 수 있습니다. 이와 유사한 상황 및 그 해결 방법에 대해 다룬 기존 질문을 찾아드리겠습니다.

이 에러는 보통 데이터프레임에 대해 그래프를 그리려고 할 때 seaborn 같은 시각화 라이브러리를 사용하면서 발생합니다. 여기서 문제는 df 데이터프레임에 중복된 인덱스 값이 존재하면 seaborn 라이브러리가 내부적으로 데이터를 재정렬하거나 인덱스를 기반으로 작업을 수행할 때 문제를 일으키는 것입니다.

해결 방안으로, 데이터프레임의 인덱스를 재설정하여 인덱스가 유일하게 만들어주는 방법이 있습니다. 대부분은 df.reset_index(drop=True)를 사용하여 인덱스를 초기화합니다. 이 방법으로 이전에 중복된 인덱스 문제로 인해 발생한 에러를 해결할 수 있었다는 내용이 있습니다. 아래의 링크에서 유사한 케이스와 해결 방안에 대한 상세 설명을 참고하실 수 있습니다.

  • Swarmplot 에러
    • 이 답변에서는 seaborn의 swarmplot을 사용할 때 발생한 유사한 ValueError: cannot reindex on an axis with duplicate labels 에러에 대해 설명하고 있으며, 데이터프레임의 인덱스를 재설정하는 방법으로 해결한 사례를 설명하고 있습니다.

간단히 말해, 질문하신 에러 해결을 위해서는 다음과 같은 코드를 시도해보시는 것을 추천드립니다.

df = df.reset_index(drop=True)
# 이후 바 그래프를 다시 그리는 코드 실행

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

341

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

212

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

477

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

292

1

피벗테이블 NotImplementedError

0

187

1