11,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
오류 질문
import pandas as pd df_amount = pd.read_csv("amount_per_year.csv") df_employee = pd.read_csv("employee_list.csv") df_merged = pd.merge(df_amount, df_employee, on='id') #print(df_merged) df_count = df_merged[(df_merged['amount']>=10) \ & (df_merged['year'] == 2020)] #print(df_count) df_count['output'] = df_count['amount'] / df_count['salary'] df_count = df_count.sort_values(['output']) print(df_count) 위와 같이 코드를 짜니 아래와 같은 오류가 떴습니다. 문제가 뭐였을까요? C:/Users/equal/PycharmProjects/pandas_practice/merge_exercise/01-2 merge_exercise.py:12: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy df_count['output'] = df_count['amount'] / df_count['salary']
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
index 부여
csv파일 두 개 모두에 index가 없다고 가정해 보았습니다. df.reset_index().rename(columns={"index": "id"}) 으로 index를 넣으니 amount_per_year에는 0~11까지 부여되고 employee_list에는 0-5까지 부여됐습니다. 원래의 amount_per_year의 파일처럼 id에 0~6, 0~6으로 넣으려면 어떻게 해야할까요?
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
엑셀정렬
csv할떈 sorted_values가 잘되는데 엑셀파일을 불러와서 적용해보면 sorted_values안되는데 엑셀은 다른건가요?
- 해결됨파이썬 판다스(pandas)로 데이터 분석 및 가공하기
판다스 불러오기중
계속 이렇게 뜨는데 해결방법은 뭡니까?
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
안녕하세요 판다스 오류떠서 질문드립니다
판다스를 이용해서 csv파일로 df를 보려하기만했는데도 오류가 납니다.. 다만 강의의 예제들은 오류없고 문제없이 작동합니다. 제가 보려는 엑셀파일은 와 같은 파일이고 엑셀내부에서도 utf-8로 인코딩하게도 바꿔봤지만 파이참에들어가서 csv파일을 선택하면 다음 사진과 같이 인코딩이 되지 못한채로 보여지고 있습니다. 물론 print(df)조차도 실행되지 않고있구요 ㅠㅠ 뭐가 문젠지 모르겠습니다 ㅠㅠ 답변 부탁드리겠습니다
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
기존 ipynb 파일(파이썬) 을 파이참으로 오픈할 수있는 방법이 있나요?
기존에 jupyter notebook 을 이용하고 있었는데 이때 썼던 코드들을 이곳에 불러와서 사용가능한가요? 그냥 불러왔더니 이렇게 나옵니다.
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
print('hello') 라고 치면 아래 워닝이 뜨면서 실행이 안되네요..?
아래 사진 확인 부탁드립니다.
- 미해결파이썬 판다스(pandas)로 데이터 분석 및 가공하기
조건에 따른 데이터프레임 수정 방법이 가능한지, 어떤 방식으로 가능한지 궁금해요.
from pandas import DataFrame as df 과자목록1 = ['초코-파이','몽-쉘','빼빼로','호두파이','별-사탕'] 과자목록2 = ['초코-파이','몽-쉘','바나나킥','땅콩파이','못난감자','초코칩쿠키','엄마손파이'] 가격1 = ['500', '1000', '700', '800', '600'] 가격2 = ['550', '1500', '750', '800', '600','500','400'] df1 = df(data={'과자': 과자목록1, '비고' : 0}) print(df1) df2 = df(data={'과자': 과자목록2,'가격':가격2}) print(df2) --------------------------- 위와 같이 코드를 입력하였을시 사진과 같이 출력이 됩니다. 이 경우에 기능 구현이 가능한지에 대해 질문 드리고자 합니다. 1. 중간중간 섞여있는 -를 제거하는 방법이 있나요? 혹은 -를 .으로 바꿀수 있나요? - 파이썬 공부할때 몇번째 순서에 있는 값을 변경하는 인덱싱/슬라이싱은 본적이 있으나 아예 무조건적으로 원하는 문자열을 전체 다 바꾸거나 지우는 기능이 있는지 궁금합니다. 2. 이 중에서 df1과 df2에 공통적으로 '초코-파이' 와 '몽-쉘' 이라는 값이 있습니다. 만일 df1과 df2에 동일한 과자가 있을 때, df2의 가격이 df1의 비고에 들어갈 수 있게 할 수 있나요?? (엑셀의 vlookup 기능(+ sumif기능도) 이 판다스에서도 가능한지 궁금합니다.) 강의를 수강하며 엑셀파일에 원하는 값을 추출하여 기본적인 전처리는 할 수 있게 되었는데 좀 더 제가 원하는 값만 추출하고 가공하는 기능에서 많이 막혀 질문드립니다. 답변 부탁드립니다. 감사합니다.
- 해결됨파이썬 판다스(pandas)로 데이터 분석 및 가공하기
판다스 데이터 처리에 대한 질문입니다.
강의 보면서 이런저런 내용들로 구글검색도 해보면서 진행하고있습니다. 선생님이 설명해주신 내용까지 이해를 하였는데 두개의 데이타에서 중복값을 찾거나 값 전체가 아닌 일부분만 바꾼다거나 그런 특수한 경우에 대해서는 좀 어렵네요... 혹시 관련되어 질문이 가능할까하여 글 남깁니다... import pandas as pdfrom pandas import DataFrame as df과자목록1 = ['초코-파이','몽-쉘','빼빼로','호두파이','별-사탕']과자목록2 = ['초코-파이','몽-쉘','바나나킥','땅콩파이','못난감자']야채목록 = ['가지','오이','토마토','콩나물','고추']가격 = ['500', '1000', '700', '800', '600']df1 = df(data={'과자': 과자목록1, '비고' : 0})df2 = df(data={'과자': 과자목록2,'가격':가격}) jul = []j = 0for i in 과자목록1 : for j in range(0, 10) : if i == df2.과자[j] jul = jul + j j = j + 1-----여러 경우를 다 만들어가보면서 진행중인데만약에 두개의 다른 과자목록이 있는 데이타프레임에서 중복값이 있다면그 행이 몇번째 몇번째인지 뽑아서 리스트로 만들어보고 싶습니다.그런데 File "C:/Users/user/PycharmProjects/py2/df.py", line 20 if i == df2.과자[j] ^ SyntaxError: invalid syntax이런 오류가 생기네요혹시 왜 그런건지 알려주실수 있을까요?