처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
iplot, plotly 그래프 크기
주피터 노트북에서 그래프를 실행시키면 이렇게 세로가 항상 짧게 나오는건데 이건 코드상의 문제인가요? 아니면 주피터 노트북 설정의 문제일까요? 수업 내용 그대로 따라가고 있고 데이터도 동일한데 그래프 모양이 항상 직사각형이 나옵니다 ㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
try , except 문 관련 질문 있어요
doc = pd.read_csv(PATH + filename, encoding='utf-8-sig') # 1. csv 파일 읽기 try: doc = doc[['Country_Region', 'Confirmed']] # 2. 특정 컬럼만 선택해서 데이터프레임 만들기 except: doc = doc[['Country/Region', 'Confirmed']] # 2. 특정 컬럼만 선택해서 데이터프레임 만들기 doc.columns = ['Country_Region', 'Confirmed'] 수업 내용 중 위 코드는 CSV 파일 갖고 올건데 컬럼 Country_Region, Confirmed 만 갖고 올거고 Country/Region 컬럼은 Country_Region 컬럼으로 바꿔줘.. 라는 의미잖아요? 그런데 실무를 하다보면 손으로 입력했을 시 Country-Region 으로도 입력되어 있을 수도 Country.Region 으로도 입력되어 있을 수도 있잖아요? 실수의 형태는 다양할테고요... 어쨌든 Country_Region 컬럼이 아니면 Country_Region 컬럼으로 바꿔달라! 라는 명령어를 쓰려면 try: doc = doc[['Country_Region', 'Confirmed' ]]except : doc.column = ['Country_Region', 'Confirmed'] 으로 작성하면 될란지요....
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
doc.groupby("컬럼명").sum() 에러
영상처럼 데이터프레임은 안나오고 에러가 나옵니다ㅠ path ="00_Material(Uploaded)/COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports/" doc = pd.read_csv(path + '04-01-2020.csv',encoding='utf-8-sig') doc = doc.groupby("Country_Region").sum() doc.head() AttributeError: 'DataFrameGroupBy' object has no attribute 'groupby'
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
fillna 관련 질문 있어요
fillna가 적용이 안되어 질문 드립니다. 데이터 프레임 만들기 + 아우터 조인 을 하였습니다. ===========================================import pandas as pddf1 = pd.DataFrame({ 'id': [1, 2, 3], 'customer_id': [1, 2, 3], 'customer_name': ['Robert', 'Peter', 'Dave']}, columns=['id', 'customer_id', 'customer_name'])df1 = df1.set_index('id') df2 = pd.DataFrame({ 'id': [1, 2, 4], 'order_id': [100, 200, 300], 'order_date': ['2021-01-21', '2021-02-03', '2020-10-01']}, columns=['id', 'order_id', 'order_date'])df2 = df2.set_index('id') data_frame = pd.merge(df1, df2, how = "outer", left_index=True, right_index=True) =============================== 결과는 이렇습니다. 각 열마다 NaN값이 있단 말이죠 그래서 customer_Id / order_id, Order_date의 Nan 값들을 다른 걸로 대체하고 싶었어요 non_data = {'customer_id': 0, 'order_id':0, 'order_Date':'0000-00-00'}data_frame_fillna = data_frame.fillna(non_data)print(data_frame_fillna) 이렇게 짰는데 여전히 order_date의 NaN 값은 그대로 있습다. 뭐가 문제인걸까요 ... 했는데 order_Date라 썼네요.. 질문 쓴 김에 지우고 싶진 않고 이렇게 공부하고 있노라고 남기고 싶어 그냥 남깁니다... 부적절한 글이면 지우셔도 됩니다. 감사합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
XML 파일 파싱 시 read_xml()함수 사용
강의 중 xml파일을 파싱하는 내용이 두 강의에 걸쳐서 길게 있는데 판다스 라이브러리 1.30 이상부터 쓸 수 있다는 pandas.read_xml 함수를 이용하면 안될까요? csv는 read_csv()를 자주 사용하는 것 같은데 xml 파일은 매번 복잡하게 데이터 프레임으로 바꿔야 하는건지 두렵네요..ㅎ 혹시 read_xml 함수를 일부로 사용하지 않으시는 거라면 그 이유도 궁금합니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
오메 갑자기 난이도가 확 올라간 느낌입니다 ㅠ
csv 함수들이 많네요..pandas 들어가기도 전에 벌써 할께 많네용pandas에 들어가기 전 이정도 csv 함수들은 인지가 되어야 하겠죠?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
IOPub data rate exceeded. 영구 설정 방법, 디렉토리 경로 변경 문의
USvideos.csv 2.8메가 파일 open 하는 과정에서 대용량의 ? 파일이라 열 수 없는 에러가 나왔습니다IOPub data rate exceeded. The Jupyter server will temporarily stop sending output to the client in order to avoid crashing it. To change this limit, set the config variable `--ServerApp.iopub_data_rate_limit`. Current values: ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec) ServerApp.rate_limit_window=3.0 (secs)찾아보니 jupyter notebook 커맨드에서 jupyter notebook --NotebookApp.iopub_data_rate_limit=1.0e10 해당 명령어를 치니 재실행과 함께 일시적으로 동작이 되다 다시 파일을 끄니 동일한 에러가 발생 하였습니다. 해당 명령어를 영구적으로 열어주는 방법명령어 이후 디렉토리 위치가 "/Document"가 디폴트로 지정 되었습니다 원래 작업 하던 경로로 옮기는 방법이 궁금합니다
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pandas-brazilian-ecommerce-EDA4.ipynb 내용중 datetime64 타입의 weekday 관련 문의
안녕하세요.그냥 강의내용 복습하다가 jupyter 파일(pandas-brazilian-ecommerce-EDA4.ipynb)에서 문의가 있는데요.이 파일에서 apply() 함수를 활용해서 weekday 를 보기쉽게 요일로 변경할 때 weekday=0 을 '일' 부터 변경하셨던데 이렇게 되면 데이터 해석이 틀려지는 거 같아서 문의드립니다.weekday=0 은 월요일인데 일요일로 변경되도록 하셔서요.답변 부탁드립니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
이 강의를 수강하는데 VS Code를 사용해도 무방할까요?
프로그래밍 알못입니다. (SQL을 통한 데이터 핸들링 정도만 해봤습니다) 파이썬 강의를 보다보면 누구는 vs code 누구는 주피터 노트북 이렇게 쓰는 것 같은데 vs code는 이미 설치되어 있습니다. 추가로 주피터 노트북도 써야 하는지요
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
로우데이터 깨짐
항상 질좋은강의 너무감사드립니다. 강사님 다름이아니라 데이터가 모두 깨져있는데 강의자료좀 받아도될까요...
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
조건 산식 표현 관련 질문 (~개 이상)
아래와 같이 연습문제에서 "~개 이상" 이라는 조건에서선생님께서는 >= 등호를 사용하지 않으시고 > 만 사용하시더라고요.저는 >= 로 알고 있었는데.. 혹시 제가 잘못 알고 있었던건가요?ㅠㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
[아나콘다 및 주피터 노트북 설치] 주피터 다운로드 후 엣지
[아나콘다 및 주피터 노트북 설치 윈도우] 7분20초 경 주피터를 다운받았는데 크롬 설정 없이 자동으로 edge로 다운로드 받아지는데 크게 상관이 있을까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
[]과 [[]]의 차이
저번에도 비슷한 질문 올렸었는데 https://www.inflearn.com/questions/1128659/%EC%B5%9C%EC%A2%85-%EC%A0%84%EC%B2%98%EB%A6%AC-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A1%9C-%EA%B7%B8%EB%9E%98%ED%94%84-%EB%A7%8C%EB%93%A4%EA%B8%B01-3-30이전에 들었던게 뭐였는지 기억이 안납니다. [[]]이 개념이 부족해서 이전강좌를 다시 들으려하는데 무슨강좌였는지 못찾겠네요, 그러니까 A[] 만 쓸때가 있고, A[[]], A[A[]] 를 쓸때가 있는데,이 거 구분하는게 너무 어려워요..payments=payments[payments['payment_type']!='not_defined' jmerged_order_date= merged_order[['order_purchase_timestamp','payment_value']].copy() merged_order_month_sum[merged_order_month_sum['payment_value'] == merged_order_month_sum['payment_value'].max()] i
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
EDA/pandas/시각화로 이커머스 거래액 상세 분석1 11:02
l1. ine 48은 실행되고line49실행될때 에러가 발생하는 이유가 뭔가요? 문법적으로 어디가 틀린거죠?line48과 49 같은 의미로 사용하려는데.payments에 order _id 있으니까 [[]]으로 다가가서 값 꺼내오는게 왜 틀렸을까요. 어떤개념이 잘못된거죠 ps line46print(payments) line48-line49
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
vscode에서는 iplot원래 못쓰나요?
iplot은 vscode에선 안되고 주피터노트북에서만 쓸수 있는건가요? import numpy as np import pandas as pd import chart_studio.plotly as py import cufflinks as cf df = pd.DataFrame(np.random.rand(10, 2), columns=['A', 'B']) df.iplot(kind='scatter', )
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
주피터노트북 업데이트 연동
이런 내용들 있잖아요.잔재미코딩님이 업데이트하면 자동으로 제 컴퓨터에 있는 내용도 업데이트되나요?아니면 따로 다시 다운로드 받아야하나요?
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
최종 전처리 데이터로 그래프 만들기1 3:30
country_info['iso2','Country_Region'] 왜 위처럼 안쓰고 []하나 더 끼워서 [[]]이렇게 만드나요?country_info[['iso2','Country_Region']]
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pandas 라이브러리로 실제 데이터 전처리하기3 7:40
import pandas as pd df=pd.DataFrame({ '성별':['남','남','남'], '이름':['David','Dave','Dave'], '수학':[100,50,80], '국어':[80,70,60] }) print(df)ㄴㅁㅇ ㅁㅇㄴ이렇게 열과 행이 이쁘게 안맞을때, 이쁘게 딱딱 맞추는건 어떻게 해야하나요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pandas 라이브러리로 실제 데이터 전처리하기2 8:42
ㄴㅇㄹ Province_State Country_Region Confirmed 0 Anhui China 1.0 1 Beijing China 14.0 2 Chongqing China 6.0 3 Fujian China 1.0 5 Guangdong China 26.0 6 Guangxi China 2.0 7 Guizhou China 1.0 8 Hainan China 4.0 9 Hebei China 1.0 11 Henan China 5.0 13 Hubei China 444.0 14 Hunan China 4.0 16 Jiangsu China 1.0 17 Jiangxi China 2.0 19 Liaoning China 2.0 20 Macau China 1.0 21 Ningxia China 1.0 24 Shandong China 2.0 25 Shanghai China 9.0 26 Shanxi China 1.0 27 Sichuan China 5.0 28 None None NaN 29 Tianjin China 4.0 31 None None NaN 33 Yunnan China 1.0 34 Zhejiang China 10.0 35 None None NaN 36 None None NaN 37 NaN Korea, South 1.0 Province_State Country_Region Confirmed 0 Anhui China 1 1 Beijing China 14 2 Chongqing China 6 3 Fujian China 1 5 Guangdong China 26 6 Guangxi China 2 7 Guizhou China 1 8 Hainan China 4 9 Hebei China 1 11 Henan China 5 13 Hubei China 444 14 Hunan China 4 16 Jiangsu China 1 17 Jiangxi China 2 19 Liaoning China 2 20 Macau China 1 21 Ningxia China 1 24 Shandong China 2 25 Shanghai China 9 26 Shanxi China 1 27 Sichuan China 5 28 Taiwan Taiwan 1 29 Tianjin China 4 31 Washington US 1 33 Yunnan China 1 34 Zhejiang China 10 35 NaN Japan 2 36 NaN Thailand 2 37 NaN Korea, South 1 두 코드의 차이는 return의 위치입니다.근데 왜 Confirmed 타입과 값이 이렇게 차이나나여?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용2 13:26
같은 질문이미 올라와있더라구요. 답변모두 확인해봤으나 이해하지못했고 해결하지 못했습니다.error가 나는 해당 abbebille은 올려주신 코로나확진추이 파일에 첫번째 있는 Admin 내용입니다. 진도를 못나가고 있습니다. 도움부탁드려요