처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
'str' object is not callable 이게 무슨의미의 에러인가요??
(사진)
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
데이터분석 질문...
pandas-brazilian-ecommerce-EDA2에서 payments 데이터폼을 분석하는 도중에 각 결재수단(payment_type)이 얼마나 이용되었는지에따른 그래프를 그리는 예제에 대한 질문입니다. 현재 payments 파일을 검색해본결과 전채 행의 개수는 103883개인 반면 payments['order_id'].nunique() 는 99437개인것을 알수있었습니다. 즉 primarykey와 같은 unique한 column이 아닌것같습니다. 따라서 payments[payments.duplicated(['order_id']) == True]로 검색해본결과 4446개의 row를 검색할수있었습니다! 즉, 4446개의 행은 order_id가 한번이상이라도 중복된 값을 가지고있다는 것입니다! 이에,payment_type_count = payments.groupby('payment_type')['order_id'].nunique().sort_values(ascending=False)는 payment_type credit_card 76505 boleto 19784 voucher 3866 debit_card 1528 Name: order_id, dtype: int64 라는 결과를 도출하고 해당값들을 sum한결과 103883에 미치지못하고 payment_type_count2 = payments.groupby('payment_type').count()['order_id'].sort_values(ascending=False)는 payment_type credit_card 76795 boleto 19784 voucher 5775 debit_card 1529 Name: order_id, dtype: int64 라는 결과를 보여주며 각 해당값의 합은 103883이 나옵니다. 첫번째 경우, 동일한 order_id가 동일한payment_type에대해서 여러행이 나오면 그 여러행을 한개로 세어버립니다. 두번째 결과로는 각기다른 행들에 대해 해당행의 개수만큼 count를 합니다. 따라서 여쭤보고싶은내용은, order_id와 같이 primary key가 아닌경우 (unique한 값을 가지고있지않은경우) payment_type별 개수를 구하기위한것과같이 사용할때에는 2번째 방법처럼 groupby().count()처리를 하는것이 올바른 방법인가? 입니다!! 물론 order_id가 각 order에 대해 유일한 값으로 사용되었을경우에는 2가지 방법모두 동일한 결과를 도출할것으로 생각하고있습니다! 항상 성심성의껏 답변해주셔서 감사하게생각합니다..ㅠㅠ 수강후기도 인터넷에 이번주일요일까지 작성해보도록하겠습니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
csv_file_format파일 링크관련
안녕하세요 지금 선생님의 강의를 수강중인 바이오데이터에 관심이 많은 학생입니다. 우선 양질의 강의 감사드립니다~ 다름이 아니라 이렇게 질문을 남기게 된 이유는 사소한 부분일 수 있지만 csv_file_format 주피터 노트북 파일의 첫 번째 링크인 이 링크를 접속하려 시도 했을 때 에러가 뜹니다 확인 부탁드립니다. 2. 다양한 데이터 포멧 이해하기: CSV 주요 데이터 포멧 csv, xml, json 참고: https://www.data.go.kr/search/index.do
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
html.parser?
안녕하세요. 선생님께서 강의해주신대로 청므에 xml을 입력해서 출력값을 확인하려고 하였으나 계속 아래와 같은 에러가 발생하였습니다. 근데 원래 기존의 코드의 BeautifulSoup(data_file. 'xml')에서 아래와 같이 BeautifulSoup(data_file.'html.parser')라고 수정하여 다시 실행했더니 정상적으로 출력되었습니다. 이 해결법은 구글링해서 알아낸건데, 해결방법을 제시한 블로거도 이유는 모르지만 이렇게 하면 해결된다~ 라는 식으로 적어놔서 질문드립니다. 처음에 생긴오류는 왜 생겨난것이고 어째서 저렇게 하면 해결되는 걸까요..?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
강의자료가 없습니다.
데이터 분석을 위한 최신 시각화 라이브러리 사용법 챕터에서 첫번째 강의를 듣는데 pandas-visualization-iplot이라는 강의 자료가 없습니다.ㅠㅠ 밑에 어제 댓글에 동일한 질문이 있는데 해당질문만 건너뛰고 답변이 안달려서 질문드립니다...ㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
질문드립니다!
데이터 전처리 부분 코로나 예제를 실행중 궁금한사항이 몇가지 생겨서 질문드리게되었습니다. 일단 질문이 많아서 죄송합니다...ㅠ <질문1> 1. def country_name_convert(row): if row['Country_Region'] in json_data: return json_data[row['Country_Region']] return row['Country_Region'] # 바꿀변수값을 return값으로 보내므로 doc['Country_Region']에 저장해야됨 호출////// doc['Country_Region'] = doc.apply(country_name_convert, axis=1) doc.head() 2. def country_name_convert(row): if row['Country_Region'] in json_data: row['Country_Region'] = json_data[row['Country_Region']] return row # row전체를 return하므로 doc변수에 저장 호출///// doc = doc.apply(country_name_convert, axis=1) doc.head() 두가지 경우가 같은식이 맞을까요? 하나씩 가져온 row전체를 return하는 경우도있고 바뀔값을 가져와서 호출시에 해당값으로 변경하는 경우도있는건가요? <질문2> 중간에 doc = doc.astype({'Confirmed': 'int64'}) 처리 해주었음에도 마지막에 MERGE한후 final_doc = final_doc.astype('int64')해주어야하는 이유 제가 하나씩 쳐보면서 해보았는데 final_doc = final_doc.fillna(0) 처리과정에서 0.0이 삽입되어서 처리해주어야하는건알겠는데 나머지 sum한 row들의 값이 소수점으로 예를들면 26874.0 같이 jupyter notebook화면에 나타나는 부분은 왜 그런지 이해가 되질 않습니다.ㅠㅠ 이미 위에서 정수처리를 한값을 sum했을뿐인데 float형식으로 왜 나오는지 궁금합니다. <질문3> PATH전역변수 선언 안하고 create_dateframe에서 사용될수있는이유가 무엇인가요? 보통 함수밖에서 지정한 field값은 함수내에서 전역변수처리를 해야지만 연동해서 사용할수있는것으로 알고있는데 아래코드와 같이 create_dateframe 함수에서는 매개변수로 PATH가 넘어오지도 않고 전역변수처리(GLOBE)를 하지도 않았는데 변수를 연동해서 어떻게 사용할수있는지가 궁금합니다. def create_dateframe(filename): doc = pd.read_csv(PATH + filename, encoding='utf-8-sig') try: doc = doc[['Country_Region', 'Confirmed']]
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
이커머스 데이터 분석 조언
강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다. 안녕하세요. 강의 잘 들었습니다. 데이브 리 강사님 덕분에 이커머스 데이터를 다루는 방법에 대해 경험할 수 있었습니다. 제가 이번에 온오프라인 매장이 모두 있는 유통업체에서 데이터 분석가로 일을 하게 되었습니다. 일하는 과정에서 이 수업을 통해 배운 내용을 바탕으로 응용하면 기본적인 분석이 가능하겠다는 자신감은 생겼습니다. 수업 내용 이외에 혹시 더 필요한 부분들이나 이론적인 부분들을 배우고 익힐 수 있는 공부 방향을 조언해주실 수 있을까요? 현업자 입장에서 조언 부탁드립니다. 이커머스 회사에서 데이터 분석 직무를 많이 뽑기 때문에 답변해주시면 저 뿐만 아니라 많은 사람들에게 도움이 되지 않을까 생각합니다. (참고로 인프런에 있는 강사님 강의는 모두 수강하였습니다. 인프런 강의 외적인 부분도 추천해주시면 감사하겠습니다.) 다시 한번 좋은 강의 감사합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
섹션8의 강의자료 질문입니다.
안녕하세요! 강의 너무 잘 듣고 있습니다! 다름이 아니라 섹션8 강의에서 'pandas-visualization-iplot'이름의 주피터 노트북자료가 강의자료 zip파일에 없는 것 같아서 문의드립니다..! 제가 못찾는 건지.. 찾아봤는데 아무리 봐도 없네요 ㅜㅜ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
섹션7 pandas 라이브러리로 실제 데이터 전처리하기2 질문
안녕하세요. 강의 잘 듣고있습니다. 예제 파일처럼 Country_Region에서 동일해야 할 값들이 다른 경우 (China, Mainland China 등등) country_convert라는 json파일을 따로 만들고 여기서 불러와서 해결하셨는데요, country_convert라는 파일안에는 key와 value들이 모두 정리가 되어서 실습할 때는 편하게 활용했는데, 실전에서도 잘못된? key들을 모두 찾아서 value정리를 쉽고 빠르게 하는 방법이 따로 있을까요? 강의에서는 country_convert파일 처럼 정리? 하는 내용은 따로 없는 것 같아서요! 혹시 질문이 모호하다면 다시 정리해서 질문 드리겠습니다! 감사합니다.
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
PIP 설치법 관련
가장 빠른 시각화 라이브러리 사용법 이행 강의 내용 중에 plotly , chart_stuodio 설치 하는 부분이 있는데 저처럼 잘 안되시는 분들이 있을 것 같아서 공유 드립니다. (window 10 기준) 1. pip 환경 변수 설정 : 이게 안되어 있으면 CMD에서 pip가 동작 하지 않습니다. 해결법은 하기 블로그 참조 https://m.blog.naver.com/PostView.nhn?blogId=lee95292&logNo=221205091279&proxyReferer=https:%2F%2Fwww.google.com%2F 2. CMD 관리자 모드로 실행 : 관리자 모드로 실행하지 않으면 pip 명령어는 작동해도 실제로 설치가 되지 않습니다. 방법은 하기 블로그 참조 https://itgroovy.tistory.com/605 다른 경우도 있을지도 모르겠네요... 모두들 완강을 위해서 화이팅!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
마지막 예제 풀이가 없습니다.
마지막 문제 풀이를 안 하고 지나가셨습니다. 예제 파일에서도 답안이 없습니다. 3. 00_data/text_data_practice.txt 파일 읽고, 다음과 같이 출력되는지 확인하기 유치원A 초등학교B 중학교C 고등학교D 대학교E 아래는 제가 풀이한 코드인데요. 반복문으로 출력하면 한 행씩 공백이 발생합니다. 예제처럼 이어서 출력할 순 없을까요? data_file = open('00_data/text_data_practice.txt', 'r', encoding='utf-8-sig') data_lines = data_file.readlines() for data_line in data_lines: print (data_line) data_file.close()
- 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
강의자료 개인 Github관련하여 문의드립니다.
삭제된 글입니다
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
라이브러리의 의미는 무엇인가요
.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
강의 공부 순서 질문
1. 파이썬 입문과 크롤링 기초 부트캠프 (파이썬과 데이터 수집 기본) 2. Scrapydhk Selenium 정복 (데이터 수집(크롤링) 중급) 3. SQL과 데이터 저장/분석 기본 (데이터 저장/분석) 4. NoSQL(mongodb) 빅데이터 기본 (빅데이터 저장/분석) 5. 파이썬 데이터 분석 기본 (데이터 분석) 제가 1번과 2번 강의(데이터 수집)을 듣고나서 데이터 분석과 관련된 5번강의를 먼저 수강한후에 데이터 저장과 관련된 3번과 4번 강의를 들을려고 생각하는데 순서대로 듣는게 강의특성상 나을까요? 아니면 순서는 중요하지 않나요?? 3번과 4번에서 배운 지식이 이번 강의(5번 강의)를 이해하는데 필수적인지 질문드립니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
카테고리_이름 데이터셋
안녕하세요. 강의 잘 듣고 있습니다. 제공해주신 데이터 파일 중에는 product_category_name_translation.csv 파일이 없어 csv를 읽어올 때 오류가 나는데 그 부분 확인 가능할까요? 그리고 강의 자료를 한번에 모아서 받을 수 있는 기능이 있는지도 궁금합니다. 자료가 많아서 한번에 정리하고 싶어서요. 감사합니다. 덕분에 데이터 분석에 대한 방향성이 좀 보입니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
강의자료가 열리지 않습니다.
안녕하세요? 알찬 강의 너무 잘 듣고 있습니다 ^^ 다름이 아니라 강의자료 중 pandas_data_processing 파일이 열리지가 않네요.. 쥬피터 노트북에서 열려고 하면 아래와 같은 메시지가 뜨더라구요.. 확인 부탁드립니다 :)