처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pandas 라이브러리로 실제 데이터 전처리하기2 8:42
ㄴㅇㄹ Province_State Country_Region Confirmed 0 Anhui China 1.0 1 Beijing China 14.0 2 Chongqing China 6.0 3 Fujian China 1.0 5 Guangdong China 26.0 6 Guangxi China 2.0 7 Guizhou China 1.0 8 Hainan China 4.0 9 Hebei China 1.0 11 Henan China 5.0 13 Hubei China 444.0 14 Hunan China 4.0 16 Jiangsu China 1.0 17 Jiangxi China 2.0 19 Liaoning China 2.0 20 Macau China 1.0 21 Ningxia China 1.0 24 Shandong China 2.0 25 Shanghai China 9.0 26 Shanxi China 1.0 27 Sichuan China 5.0 28 None None NaN 29 Tianjin China 4.0 31 None None NaN 33 Yunnan China 1.0 34 Zhejiang China 10.0 35 None None NaN 36 None None NaN 37 NaN Korea, South 1.0 Province_State Country_Region Confirmed 0 Anhui China 1 1 Beijing China 14 2 Chongqing China 6 3 Fujian China 1 5 Guangdong China 26 6 Guangxi China 2 7 Guizhou China 1 8 Hainan China 4 9 Hebei China 1 11 Henan China 5 13 Hubei China 444 14 Hunan China 4 16 Jiangsu China 1 17 Jiangxi China 2 19 Liaoning China 2 20 Macau China 1 21 Ningxia China 1 24 Shandong China 2 25 Shanghai China 9 26 Shanxi China 1 27 Sichuan China 5 28 Taiwan Taiwan 1 29 Tianjin China 4 31 Washington US 1 33 Yunnan China 1 34 Zhejiang China 10 35 NaN Japan 2 36 NaN Thailand 2 37 NaN Korea, South 1 두 코드의 차이는 return의 위치입니다.근데 왜 Confirmed 타입과 값이 이렇게 차이나나여?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용2 13:26
같은 질문이미 올라와있더라구요. 답변모두 확인해봤으나 이해하지못했고 해결하지 못했습니다.error가 나는 해당 abbebille은 올려주신 코로나확진추이 파일에 첫번째 있는 Admin 내용입니다. 진도를 못나가고 있습니다. 도움부탁드려요
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
수강자료 다운로드 오류
수강자료 다운로드 받았는데 자꾸 확인되지 않음 이라고 뜨네요어떤 오류인지 모르겠습니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pyplot 관련 에러
- EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용2의 13분정도에서 다음과 같이 에러가 나는데 어떻게 해결해야할까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
10:37 doc_final_country = doc_final_country[cols] 문법 해석
10:37 doc_final_country = doc_final_country[cols] 이 구문의 의미는변수 doc_final_country가 doc_final_country[cols] 를 가리키는 의미가 아닌가요...? 그러면 doc_final_country가 Series 형태인 doc_final_country[cols] 만 출력되어야 하는데, 어째서 doc_final_country에서 iso2의 위차만 변경되어서 나타나는지 궁금합니다 ``
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
한단계 더 이해하는 EDA와 데이터 타입에 따른 시각화 기법5
위 코드를 실행하니 'could not convert string to float: 'Abbeville' 라는 에러가 전시됩니다.Abbeville를 float으로 바꿀 수가 있나요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
혹시 Scrapy와 Selenium 정복 강의는 어디있나요??
관심있는 강의내용이라 듣고싶은데지금은 못듣나요??
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
JSON 포맷 이해와 파이썬으로 JSON 파일 다루기 질문
위 캡쳐본에서 "language" : {"Java" : "basic", "Java" : "advance"} 라고 작성 시출력 부분에서 "language" : {"Java" : "advance"}만 출력이 됩니다. "language" : {"Java" : "basic", "Java2" : "advance"}라고 작성 시출력 부분에서 "language" : {"Java" : "basic", "Java2" : "advance"}가 출력됩니다. 전자의 경우는 Java값이 업데이트 되었다고 인식되어 advance만 출력이 되는건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
수업자료 다운로드
수업자료 다운로드 챕터를 클릭하면첨부파일 다운로드 받으라는 멘트만 있고다운받을 수 있는 버튼이 안 보입니다. ㅜㅜ수업자료는 어디서 받을 수 있는건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
apply axis 관련 질문
섹션7-2 5분 2초 apply부분에 apply(func, axis = 0)으로 하면 왜 '영어' 행이 하나 더 생기나요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
함수 (function without return) none출력 질문
def awe_sum(a,b): print(int(a)+int(b))a=2b=3print(awe_sum(a,b))이 코드 실행 결과5 None아래처럼 나오는데 밑에 None은 왜 생기는 건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
dataframe.iplot
항상 좋은 강의 감사드립니다!merged_order_month_count.iplot(kind='bar', theme='solar')iplot의 옵션 중에 그래프의 크기를 지정할 수 있나요 ?예를 들면, graph-object의 fig.update_layout(autosize=False, width=1000, height=800)
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
질문드립니다.
EDA/pandas/시각화로 이커머스 구매 카테고리 분석 7분 11초에서 products_category_order = products_category_order.groupby('product_category_name_english').aggregate({'order_id':'count'}).rename(columns={'order_id':'order_count'}) 에 대해 설명하신것을 들었습니다. 이거는 agg를 통해 order id의 갯수만나타낸 건데 가격의 합계를 sum으로 같이 나타내고 싶으면 어떻게 코딩을 해야하는 것인지 궁금합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
모듈 설치 오류
안녕하세요 저는 아나콘다를 통해서 설치를 했고 pip list를 통해 3개가 모두 설치 된 것을 확인했습니다. 그런데 정작 주피터에서는 아래와 같은 오류가 뜹니다. 무엇이 문제인가요. 1년전 쯤에 올려주신 방법으로도 오류가 발생해 질문 올립니다.Unable to create process using 'C:\Users\KWON\anaconda3\python.exe "C:\Users\KWON\anaconda3\Scripts\pip-script.py" install plotly chart_studio'
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
9분경에 나오는 for file in csv_list 코드부분에서 질문이 있습니다.
for file in csv_list: doc = create_dateframe(file) final_doc = pd.merge(final_doc, doc, how='outer', 이하생략)final_doc = final_doc.fillna(0return final_doc 이렇게 코드를 작성해도 되지 않을까?라는 생각이 들었는데, 굳이 if문을 거치는 이유가 무엇인가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
EDA/pandas/시각화로 이커머스 고객 상세 분석하기 강의 질문
실제 이 강의의 초반3분 안에 customers['customer_unique_id'].value_counts().max() 을 실행하면 17이라는 값이 나왔고 customers['customer_id'].value_counts().max()를 실행하면 1이라는 값이 나와 customer_id에는 중복이 없고 customer_unique_id에는 중복이 있음을 확인했었습니다.그런데 본 강의의 3분정도에서 customers['customer_id'].nunique() 을 출력하면 99441이 나오고 customers['customer_unique_id'].nunique()을 출력하면 96096이 나오는데customer_unique_id에서 중복된 것들을 다 제외시키면 customer_id의 값이 나와야 되는것 아닌지가 궁금합니다. 어떻게 이 customers['customer_unique_id'].nunique() 구문의 값이 99441이 아닌 96096이 나오게 되는지 궁금합니다. 이러면 customer_id에도 중복이 있다는 소리 아닌가요? 강사님께서 강의중에 96096이라는 숫자를 가르키시며 잘못작성하셨다고 했는데 제가 실행해도 96096이라는 숫자가 나와서요,,,ㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
4분 30초경 데이터프레임 합치는 부분 질문입니다
안녕하세요 4분 30초경 질문입니다doc = pd.merge(doc1, doc2, how='outer', left_index=True, right_index=True)를 사용하면 doc1과 doc2의 양쪽 인덱스를 기준으로 데이터프레임이 병합되는 걸로 이해했는데요left_index=True만 사용해서 왼쪽 인덱스를 기준으로 병합할 수는 없나요? doc = pd.merge(doc1, doc2, how='outer', left_index=True)를 사용하니 오류가 나고 GPT는 left_index=True)만 사용해도 병합이 가능하다고 하는데 실제로는 강의처럼 없는 날짜가 NAN이 될 줄 알았는데 오류가 발생해서 질문 드립니다
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일 절대경로 상대경로 질문있습니다
선생님csv파일 다루기 영상 공부하다가, 자꾸만 똑같이 따라했는데도 파일이 안열려서, 절대경로로 했더니열리더라고요근데 왜 상대경로는 안열리는지 너무 궁금합니다제가 캡쳐해서(1.절대경로,2.상대경로) 보내드리는데 ㅠ 절대경로 주소보시고 상대경로는 어떻게 찾아야 하는지 알려주시면 감사하겠습니다 ㅠㅠㅠㅠㅠㅠㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
orders에는 있느나 payments에는 없는 order_id
안녕하세요, 선생님.평균거래액과 관련해 데이터를 확인하던 중 거래 기록과 지불 기록이 일치하지 않는 order_id가 있는 것 같아 아래와 같이 확인해보았습니다.unique order_id 개수 확인: orders와 payments의 'order_id'에서 유니크한 값의 개수를 확인해보니 각각 99,441개와 99,440개로 나왔습니다.print(orders['order_id'].nunique(), payments['order_id'].nunique()) results: 99441 99440가정) orders 기록에는 있으나 payments에서 누락된 데이터가 1개 있다payments 누락 order_id 확인missing_values = ~orders['order_id'].isin(payments['order_id']) missing_values_in_order = orders['order_id'][missing_values] missing_values_in_order results: 30710 bfbd0f9bdef84302105ad712db648a6c확인된 내용) 'bfbd0f9bdef84302105ad712db648a6c'는 oreders에는 있으나 payment에서는 누락된 'order_id'이다order_id가 'bfbd0f9bdef84302105ad712db648a6c' 인 값의 세부사항 확인확인된 내용) 'bfbd0f9bdef84302105ad712db648a6c' 거래는 '2016-09-15'의 order이고, order_item에서도 거래액을 확인할 수 있으나, payments 기록에서는 확인할 수 없다Q1) 상기의 데이터 확인 과정이 적절한지 여쭤보고 싶습니다.Q2) 이런 경우는 아마도 거래 기록은 있고, 거래 금액까지는 있으나 이후에 취소가 되었거나 등으로 payments에서 삭제된 데이터로 추측할 수 있을까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
수업 자료 보내주세요
강의 잘 듣고 있습니다. 복습차원에서 강의에서 사용하신 수업자료가 필요해요. flamevert@naver.com으로 보내주세요