묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결내 업무를 대신 할 파이썬(Python) 웹크롤링 & 자동화 (feat. 주식, 부동산 데이터 / 인스타그램)
pd.concat(df, ignore_index=True) InvalidIndexError 해결 방법 문의
안녕하세요.아래 코드에서 마지막 부분에서 에러가 발생하는데 찾아봐도 해결을 못하겠습니다. # 최종 데이터 합치기 df1 = pd.concat(df, ignore_index=True) --------------------------------------------------------------------------- InvalidIndexError Traceback (most recent call last) Cell In[89], line 2 1 # 최종 데이터 합치기 ----> 2 df1 = pd.concat(df, ignore_index=True) File ~\anaconda3\Lib\site-packages\pandas\core\reshape\concat.py:393, in concat(objs, axis, join, ignore_index, keys, levels, names, verify_integrity, sort, copy) 378 copy = False 380 op = _Concatenator( 381 objs, 382 axis=axis, (...) 390 sort=sort, 391 ) --> 393 return op.get_result() File ~\anaconda3\Lib\site-packages\pandas\core\reshape\concat.py:676, in _Concatenator.get_result(self) 674 obj_labels = obj.axes[1 - ax] 675 if not new_labels.equals(obj_labels): --> 676 indexers[ax] = obj_labels.get_indexer(new_labels) 678 mgrs_indexers.append((obj._mgr, indexers)) 680 new_data = concatenate_managers( 681 mgrs_indexers, self.new_axes, concat_axis=self.bm_axis, copy=self.copy 682 ) File ~\anaconda3\Lib\site-packages\pandas\core\indexes\base.py:3875, in Index.get_indexer(self, target, method, limit, tolerance) 3872 self._check_indexing_method(method, limit, tolerance) 3874 if not self._index_as_unique: -> 3875 raise InvalidIndexError(self._requires_unique_msg) 3877 if len(target) == 0: 3878 return np.array([], dtype=np.intp) InvalidIndexError: Reindexing only valid with uniquely valued Index objects ============================ df = []articleNos = ['2433459189','2433504511']for articleNo in articleNos: ind_url = f'https://new.land.naver.com/api/articles/{articleNo}?complexNo=' res = requests.get(ind_url, headers=headers) ind_dict = res.json() article_df = pd.Series(ind_dict['articleDetail']).to_frame().T # articleDetail_df = articleDetail_df[['articl/eNo','articleName','buildingTypeName','realestateTypeName', 'tradeTypeName', 'cityName','divisionName', 'sectionName', 'etcAddress', 'monthlyManagementCost', 'buildingName']] if 'articleFloor' in ind_dict.keys(): articleFloor_df = pd.Series(ind_dict['articleFloor']).to_frame().T article_df = pd.concat( [ article_df, articleFloor_df, ], axis=1 ) else: print(articleNo, '/', 'articleFloor') # articleFloor_df = articleFloor_df[['totalFloorCount','correspondingFloorCount']] if 'articlePrice' in ind_dict.keys(): articlePrice = pd.Series(ind_dict['articlePrice']).to_frame().T article_df = pd.concat( [ article_df, articlePrice, ], axis=1 ) else: print(articleNo, '/', 'articlePrice') # articlePrice_df = articlePrice_df[['dealPrice','allWarrantPrice','allRentPrice']] if 'articleRealtor' in ind_dict.keys(): articleRealtor = pd.Series(ind_dict['articleRealtor']).to_frame().T article_df = pd.concat( [ article_df, articleRealtor, ], axis=1 ) else: print(articleNo, '/', 'articleRealtor') # articleRealtor_df = articleRealtor_df[['realtorName','representativeName','cellPhoneNo','representativeTelNo']] if 'articleSpace' in ind_dict.keys(): articleSpace = pd.Series(ind_dict['articleSpace']).to_frame().T article_df = pd.concat( [ article_df, articleSpace, ], axis=1 ) else: print(articleNo, '/', 'articleSpace') # articleSpace_df = articleSpace_df[['supplySpace','exclusiveSpace']]# article_df = pd.concat(# [# articleDetail_df,# articleFloor_df,# articlePrice_df,# articleRealtor_df,# articleSpace_df, # ],# axis=1# ) df.append(article_df) # 최종 데이터 합치기 df1 = pd.concat(df, ignore_index=True)
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
deep_data_and_visual 파일에서 에러가 납니다.
안녕하세요. 수강생입니다.현재 저는 손코딩은 하지 않고 처음부터 끝가지 영상으로 한번 보고 두번째부터 손코딩하려고 계속 보는중입니다.따라서 문법을 이해하기 보다는 아~그렇구나 정도 알고 있습니다. 또한 제 데이터는 특별히 손을 대지 않고 실행만 하고 있습니다. 그런데 지금까지 큰 이슈없이 잘 진행되다 Heapmap에서 에러가 발생합니다.deep_data_and_visual 1:48의 결과값도 저랑 다르고 heatmap 작성시 에러가 ValueError: could not convert string to float: 'Abbeville' 발생합니다. 문자열을 float으로 못바꾸는건 알겠는데 직접 파일에서 관련 데이터를 지우라는 것인지(그렇다면 문자열 컬럼은 다 지워야 하는데 좀 이상한거 같구요), 코딩으로 원하는 데이터만 추출해서 가져와야 하는건지(그렇다면 저는 처음부터 영상을 다시 봐야하구요), 제 데이터만 이상한건지(그럼 다시 설치하구요.. 물론 다시 복붙해봤습니다.) 궁금합니다 .
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
apply()함수
pandas_real_data_processing 강의자료에서 def func(df_data): print (type(df_data)) print (df_data.index) print (df_data.values) return df_data 를 통해 함수 func을 정의했는데, df_func = df.apply(func, axis=0) 에서 func에 넣어줄 df_data 매개변수가 없었는데 계산결과가 나타난 이유가 궁금합니다.제 생각엔 func(무언가) 가 들어 있는 형태로 사용될 거 같았는데 그러지 않아서요...
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문
섹션 4 부분 마지막 강의인 인코딩 이해하고 적용하기 라는 강의의 14분 50초에 나오는 pd.getdummies()에 관한 질문이 있습니다.강의 내용대로 실행을 시켜보니 df_onehot.head()의 내용이 True/False의 형태로 나오는 것을 확인했습니다.서칭 후 pd.get_dummies(df_label, columns=onehot_cols, dtype = int) 처럼 dtype을 int형태로 바꾸어주니 강사님이 보여주신 화면대로 나오는 것을 확인했습니다.이것 역시 버전차이로 인한 기능 변화라고 이해하면 되나요?
-
해결됨파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
선생님 ㅠㅠ 뭐가 문제일까요 spot검색후.ㅠ
선생님.. 이렇게 떠서 연필모양 클릭이 안되요 ㅠㅠ..뭐가 문제일까요
-
해결됨파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
선생님 안녕하세요!.. 오류 문의드립니다.
승인된 LowPriorityCores 할당량을 초과하므로 작업을 완료할 수 없습니다. 추가 세부 정보 - 배포 모델: Resource Manager, 위치: KoreaCentral, 현재 제한: 3, 현재 사용량: 0, 추가 필요: 16, (최소) 새 제한 필요: 16. 할당량이 임계값에 도달할 때 경고를 설정합니다. https://aka.ms/quotamonitoringalerting에서 자세히 알아보세요. 배포가 성공할 수 있도록 '세부 정보' 섹션에 나열된 매개 변수를 지정하여 https://aka.ms/ProdportalCRP/#blade/Microsoft_Azure_Capacity이게.. 저도 클라우딩 컴퓨터가 처음이라 익숙하지가 않는데 ㅠ 이렇게 오류가 뜹니다.. 계정이 유료?로 전환되었는지도 모르겠고요 ㅠㅠ 일단 앞의 강의 에서 spot이게 검색해도 아무것도 뜨지 않아서 지금 강의 부터 진행 하는데 역시 안되네요 ㅠㅠ 뭐가 문제일까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출 작업형1의 1번문제 풀이 방법
import pandas as pd df = pd.read_csv("student_assessment.csv") df = df.dropna(subset='score') df = df.sort_values('id_assessment', ascending=False) cond = df['id_assessment'] == 133 df = df[cond] df_1 = df.copy() cols = list(df.columns[df.dtypes != object]) cols from sklearn.preprocessing import StandardScaler ss = StandardScaler() df_1[cols] = ss.fit_transform(df_1[cols]) df['score_ss'] = df_1['score'] df = df.sort_values('score_ss', ascending=False)['score_ss'] print(round(df.max(), 3))이렇게 풀면, 답이 '1.462'로 다른 값이 나오는데, 왜 이렇게 되는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강연장 여쭤보아요~:)
업무 등으로 신청하고 올해 11월에 첫 시험을 보려고 합니다.10월 초면 강의가 끝나는데요...혹시 가능하시다면 11월말까지만 연장 가능할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 여쭈어봅니다
선생님 안녕하세요. 제가 직장 이직 등으로 준비를 그동안 못하다가 이제 시간이 나서 12월 실기를 준비하려고 합니다... 수강 기간이 얼마 남지 않았는데 연장을 부탁드리고 싶습니다...
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
에러 메시지
df 불러오기는 잘 되지만, df를 데이터로 이용하여 바 그래프 작성시 에러 메시지가 나와요. 답변 부탁드립니다. 감사합니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
그래프 색이 동일하게 나옵니다.
안녕하세요,바 그래프, 선 그래프 등 아무런 설정을 지정하지 않았는데 동일한 색으로만 나옵니다. 강의내용에서 보이는 것처럼 칼라풀하게 그래프가 나오지 않네요. 설정을 조정해야하나요?감사합니다.
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
Crash 파일 위치
쥬피터 노트북에서 crash 강의를 수강하려는데 다운 받은 파일집에는 영상과 다른 00.Table of contaent파일로 존재하는데 어떻게 수강해야하나요?
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
시각화 라이브러리 비교
안녕하세요 시각화에서 plot.express 대신 matplotlib을 사용하시는 이유를 알 수 있을까요?
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
pandas groupby sum 질문
안녕하세요 강의를 잘 듣고 있는데 pandas groupby질문이 있어서 문의드립니다.강의 내용에서는 groupby을 할 경우 이후에 sum이나 mean이 올 경우 숫자 데이터는 sum이나 mean이 수행이 되고 텍스트 데이터는 사라진다고 강의에 말씀하였는데 저같은 경우는 sum의 경우 텍스트가 단순히 합쳐지고 mean같은 경우는 아래 캡쳐 화면과 같이 에러가 발생합니다.하지만 아래 캡쳐 화면과 같이 sum이나 mean할 항목을 명시해 주면 원하는 수행을 하게 되는데요 이럴 경우에는 앞으로는 mean이나 sum을 할 항목을 명시해주면 될까요??(파이썬 버전은 jupyter를 설치해서 3.12.4 입니다)
-
미해결금융데이터 분석을 위한 판다스 활용법
21년 12월 말일 데이터 관련
안녕하세요.21년 12월 마지막 데이터는 28일이지만 이 날짜가 12월 마지막 데이타 라고 생각합니다.그래서 22년 1월 2일 데이터를 더미로 넣는게 좋다고 생각합니다.감사합니다.
-
미해결머신러닝/딥러닝 소개 및 학습을 위한 파이썬 속성 과정
수업진행 파일
깃허브에서 파일다운은 Python_Basic_to_Advanced-main로 했는데 수업진행은 SW_DL_Pytorch-main.폴더로 진행되는거 같습니다 파일 구성내용 자체가 다릅니다 sw폴더는 어디서 다운받나요? crash 부터 따라가려고 합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번에 불합격했는데요 ㅠㅠ
올해 말에 다시 보려는데 10월초면 강의가 끝나더라고요ㅜㅜ불합격했는데 수강연장은 안될까요?11월말이 시험인데 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
비전공자 직장 병행 합격했습니다.
비전공자(심지어 법학 전공입니다)에 직장 병행하면서 시험 준비했는데,강의 듣고 한번에 합격할 수 있었습니다. 강의가 체계적으로 잘 구성되어 있어서정말 도움이 많이 되었습니다. 시험 전날 늦은 시간에 질문 올렸는데도 친절하게 답변해주셔서 감사합니다.답안 제출 못할 뻔 했는데 빠르게 답변해주셔서 숙지하고 답안 잘 제출할 수 있었습니다 ㅎㅎ;
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다
사실 아래 질문과 답변이 있으나 해결이 되질 않습니다강사님 강의 파일에 있는pandas_eda에 있는 코드 아무것도 안건들이고그냥 실행만 했을 뿐인데...(강의 시간 14:29) 여기는 숫자 다 잘나오는데전 숫자가 하나도 안나오네요;;;
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?
vscode에서 ipynb파일에서 iplot사용 동일한 에러가 발생합니다. 타이타닉 문제로 시작하는 EDA: 수치형 데이터 분석 패턴1에서df.corr(numeric_only=True).iplot(kind='histogram', histfunc='count')했는데해당 에러가 발생합니다.현재 버전은 이렇습니다.plotly==4.14.3cufflinks==0.17.3