묻고 답해요
129만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결Pandas 팬더스 데이터분석 기초 실습
dataframe append 불가능
Pandas v2.0.0+ 이상의 버전에서 DataFrame.append 메소드를 사용할 경우 아래의 에러가 발생합니다.'DataFrame' object has no attribute 'append'. Did you mean: '_append' 따라서 아래와 같이 데이터프레임의 row를 추가해야 합니다.import numpy as np import pandas as pd friend_list = { "name": ["John", "Jenny", "Nate"], "midterm": [95, 85, 85], "final": [90, 90, 70], } df = pd.DataFrame(friend_list) df2 = pd.DataFrame([["Ben", 90, 95]], columns=["name", "midterm", "final"]) new_df = pd.concat([df, df2]) print(new_df)
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
dataframe 열 수 설정 코드 질문
강의 9분 경에 DataFrame 열 수 설정 코드에서 pd.set_option('max_columns', None)으로 해주셨는데 에러가 나서 구글링해보니 pd.set_option('display.max_columns', None)으로 다들 되어 있더라구요. 두 코드의 차이가 있는 것인지 알고 싶습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
DataFrame Groupby 시 Aggregation 관련
안녕하세요? 강의 잘 듣고 있습니다. DataFrame Groupby 시 Aggregation 을 위해 dictionary 를 적용하는 경우, 동일한 key 값에 두 가지 function 을 할당하여 생기는 문제에 대한 해결책으로 named aggregation 을 사용하셨는데요, 리스트를 사용하는 것이 좀 더 간단하지 않을까요? 예) agg_format = {'Age' : 'max', 'Age' : 'mean' , 'Fare' : 'mean' } titanic_df.groupby('Pclass').agg(agg_format) 위와 같이 사용할 경우 'Age' 키값에 'max' 가 조회되지 않는 문제가 있지만, agg_format = {'Age' : ['max' ,'mean'] , 'Fare' : 'mean' } 이와 같이 list를 value 값으로 주면 named aggregation 보다 코드가 간결해지며, display 시 max, mean 등 함수명이 column에 표기되므로 시각적으로도 더 나아 보입니다. 또한, 하나의 Aggregation 함수만 사용하는 경우에도, 아래와 같이 리스트를 사용하면 각 Column에 적용된 함수가 무엇인지 명시적으로 display 되게 할 수 있습니다. agg_format = {'Age' : ['max' ] , 'Fare' : ['mean'] }
-
미해결
파이썬 판다스 질문합니다.
안녕하십니까? 파이썬 공부중인 학생입니다. 도저히 어떻게 해결 해야 할지 모르겠어서 질문 남깁니다. 1. data=[{'A':'0000','B':1234}, {'A':'0200','B':151}, {'A':'0300','B':11},{'A':'0400','B':2014},{'A':'1600','B':32}] 가 있습니다. 2. 이 데이터를 data = pd.DataFrame(data) 로 정의하여 새롭게 만듭니다. 3. 아래(맨밑) 와 같은 엑셀 포맷을 excel_format = load_workbook('엑셀포맷.xlsx',data_only=True) 로 불러왔습니다. 4. 불러온 포맷을 data의 값으로 자동으로 채워주고 싶습니다. 하지만 1. data 를 보시면 'A':'0100' 값과 또 중간에 'A':0500~1500까지의 B 값이 없습니다. 이러한 부분을 B를 0 으로 채워주고 'A':'0000','A':'0200','A':'0300','A':'0400','A':'1600'처럼 B값이 있는값들은 그에 맞게 B값을 채워주고싶습니다. load_ws.cell(1,2,350) 이런식으로 일일이 없는값은 0으로 채우고 있는값은 데이터를 보고 채울순있겠지만 꼭 자동화로 되도록 코드를 작성하고싶습니다. 긴 글 읽어주셔서 너무 감사합니다.
-
미해결실전 데이터 사이언스 Part2. 데이터 전처리
6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문
안녕하세요. 주피터노트북으로 따라하던 도중 에러가 났는데 어떻게 고칠줄 몰라 여쭈어봅니다. 37줄을 프린트하면 Key error가 납니다. # 키, 몸무게 데이터를 각각 표준 스케일링한 후 컬럼에 추가 df = df_raw.copy() # 백업 데이터 사용 (결측치 없는) df[:10] from sklearn.preprocessing import StandardScaler scale = StandardScaler() #make constructor - 하나의 객체를 만들었다. df["h_sc","w_sc"] = scale.fit_transform(df["height","weight"]) df[:5] KeyError: "None of [Index(['h_sc', 'w_sc'], dtype='object')] are in the [columns]" 이런 에러가 뜨는데 해결방법을 알 수 있을까여??