처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
주피터 노트북 코드 실행이 갑자기 안될땐 어떡해야 하나요
잘 되다가 오늘 이용하려는데 쉬프트 엔터, 혹은 컨트롤 엔터 눌러도 ln(*) 만 들어오고 실행이 안되네요... 쥬피터다시깔아보고 노트북 껏다켜보기도 했는데 왜이럴까요 A connection to the notebook server could not be established. The notebook will continue trying to reconnect. Check your network connection or notebook server configuration. 이런 오류가 나오긴 합니다..
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
data_file.write 관련 질문
- 본 강의 영상 학습 관련 문의에 대해 답변을 드립니다. (어떤 챕터 몇분 몇초를 꼭 기재부탁드립니다)- 이외의 문의등은 평생강의이므로 양해를 부탁드립니다- 현업과 병행하는 관계로 주말/휴가 제외 최대한 3일내로 답변을 드리려 노력하고 있습니다 - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요, '파이썬으로 Plain text 포맷 파일 다루기' 영상에서 6분대 - Data 쓰기 관련 설명에서 어려움을 겪고 있습니다. 데이터 입력하기 data_file.write = open('comp/00_data/text_data_practice.txt','w',encoding='utf-8-sig')를 하고나서, 밑에 원하는 데이터를 입력하고 엔터를 치면 저렇게 숫자가 뜨고 데이터가 입력되지 않네요. ㅜㅜ Write 말고 add로 원하는 문구를 추가하는 건 됩는데 말입니다. 완전 초보라 뭐가 잘못된지도 모르겠습니다, 혹시 어떤 문제인지 아실까요? 혹시 제가 주피터에서도 하고 idle에서도 해보고 있는데, idle 실행 방법이 잘못되었을끼요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
2:12 질문입니다.
본 강의 2분 12초에서 delivery_time을 구하기 위해 orders.loc[:, 'delivery_time'] = pd.to_datetime(orders.loc[:, 'order_delivered_customer_date']) - pd.to_datetime(orders.loc[:, 'order_purchase_timestamp'])로 -(빼기) 연산을 하는데 datetime64 dtype끼리 연산을 할때는 to_datetime()에서 format을 지정해주지 않아도 되는건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
iplot()과 plotly.graph_objects()의 heatmap에서 annotation 값 표시
강의 중에 corr()로 상관관계를 구하고 iplot()과 plotly.graph_objects()를 활용하여 heatmap을 그렸습니다. heatmap 안에 각 상관관계의 값을 표시하고 싶습니다. Seaborn에서는 sns.heatmap(annot=True)로 설정하였었는데 iplot과 plotly는 어떻게 하나요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일이 안읽혀요
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사ㅇㄹㅇㄹ한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며ㅊㅇㅊㅇ챠 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. covid 파일이 pd.read csv 함수로 안읽혀요
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
pd.merge에서 Outer join과 pd.concat
강의 잘 듣고 있습니다! 질문이 있는데, pd.merge에서 Outer join과 pd.concat이 동일한 결과를 반환하는 것 같아보이는데 동일한 연산을 수행하는 것이 맞나요??
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
customer_city 갯수가 1000개 이상인 customer_city 갯수 확인
안녕하십니까. pandas_practice_live 쥬피터 파일에서 연습문제를 풀고있는데, "16. doc4에서 customer_city 갯수가 1000개 이상인 customer_city 갯수 확인" "17. doc4에서 customer_city 갯수가 1000개 이상인 customer_city 이름 확인" 이라는 말이 이해가 안되네요 ㅠㅠ customer_city는 문자열로 이루어져있는데 1000개 이상이라는게 무슨말일까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
go.Figure() 와 fig.add_trace()차이
안녕하세요 강사님. 최근 plotly library를 본격적으로 활용하고 있는데 궁금한 점이 있어 여쭤봅니다. fig = go.Figure() 안에 데이터를 담아 출력하는 방법과 fig.add_trace() 를 사용해 그래프를 사용하는 방법이 plotly official docs에서 번갈아 가며 사용하는 것을 확인했습니다. ex) fig = go.Figure(data = [trace0, trace1], layout = layout) fig = go.Figure() + fig.add_trace(trace0) 혹시 위 두 방법간에 사용하는 특정한 기준이 있는 것일까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
4분 drop_duplicates 질문드립니다
혼자서 데이터를 파헤쳐보며 연습하고 있는데요,keep='last'조건을 주신거에대한 반례가 있는것 같아서 질문드립니다. 다음과 같이 US는 굉장히 많은 iso2들이 있습니다.이 경우는 운좋게 keep='last' 적용했을 때 US로 출력됩니다. 하지만 이 경우에는 덴마크에 대한 iso2(아마 지역구 별로 다르게 입력됐었던 것 같습니다) 는 덴마크의 keep='last'로 다뤘을때 옳은 값인 DK가 아닌 GL로 출력되게 되는데요. 이런 현상에 대해서 전체적으로 keep='last'를 적용하는게 맞나 싶어서 질문드립니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
2분30초 부분 질문
doc['Country_Region'] = doc.apply(country_name_convert, axis=1) 이 코드가 왜 doc = doc.apply(country_name_convert, axis=1) 이게 아니라 컬럼을 지정해서 적용해야하는지 이해가 가질 않습니다. 어차피 country_name_convert 함수에서는 column에만 작용하고, column에 한에서 수정이 들어가게 만들어졌는데 왜doc=가 아닌doc['Country_Region']=이렇게 식이 지정되어야하는지 모르겠습니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
try, except 질문있습니다!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 해당 강의에서 특정 column만 선택해서 데이터프레임을 만드는 것을 공부하는 중입니다. 강의 중 import pandas as pd data = pd.read_csv('abc.csv', encoding = 'utf-8-sig', error_bad_lines = False) try: data = data[['id', 'level']] except: data = data[['id', 'id_level']] data.columns = ['id', 'level'] 이 처럼 try except를 사용하여 해결하였는데, 만약 raw data의 같은 의미의column 종류가 여러 형태로 되어있다면 아래와 같은 형식을 써도 문제가 안 되는지를 여쭙고 싶습니다! try: A except: try: B except: try: C except: D A를 실행하고 ERROR가 나면 B 실행, ERROR나면 C실행 . . . 이렇게 하면 문제점이 있을까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
제이슨
Country_Region에 Mainland China를 China로 바꿔주는 부분에서 jason형태로 변환하지 않고 넘파이로 변환한 다음에 for문을 돌려서 바꿔주는 부분은 안되는건가여 ?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
마지막 3번 문항 (파일 읽고 출력하기)
안녕하세요. 마지막 문항을 푸는데 계속 오류 메시지가 뜹니다. data_file=open('00_data/text_data_practice.txt','r',encoding='utf-8-sig') data = data_file.read('유치원\n') data = data_file.read('초등학교\n') data = data_file.read('중학교\n') data = data_file.read('회사\n') data_file.close() 혹시 어디부분이 잘못된걸까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
학습자료파일 관련 질문드립니다.
혹시 학습자료폴더에서 DaveLee_20200810의 하위폴더인 __MACOSX 안에 있는 00_Material(Uploaded) 폴더와 DaveLee_20200810 폴더의 바로 하위폴더인 00_Material(Uploaded)는 어떤 차이가 있는건가요? 용량이나 세부적인 파일이 조금 다른것같긴한데 어떤점이 다른건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일 경로 지정 (파이썬으로 Plain Text 포맷 파일 다루기) //'파이썬에서의 파일처리를 위한 기본지식 강의' 15분 50초경
안녕하세요, 선생님. 질문하나만 드립니다. 학습자료 파일들의 경우 열고싶은 파일 (여기서는 text_data.txt 라는 파일)이 주피터노트북상에 저장돼있을 필요는 없고 'open' 명령을 입력하면 주피터노트북이 알아서 지정한 경로에따라 컴퓨터에 저장되어있는 파일을 불러와주는 원리인거죠? 또한 그렇다면 왜 다음과 같이 했는데 안되는지 봐주실 수 있나요? '파이썬에서의 파일처리를 위한 기본지식 강의' 15분 50초경에서처럼 강의에서와 똑같이'00_Material(Uploaded)' 라는 폴더에 위치한 ' plaintext_file_format '라는 강의자료 파일을 주피터 노트북에 불러왔고 그 파일안에서 open을 실행하였는데 에러가뜹니다. 사진1,2에서 보시다시피 이 ' plaintext_file_format ' 라는강의자료 파일이 '00_Material(Uploaded)'라는 폴더에 저장되어 있고 같은 폴더(즉, '00_Material(Uploaded)' )안에 '00_data'폴더가 위치해있으며 그 '00_data' 폴더 안에 'text_data' 라는 파일이 있다는것을 확인 하였고,그에 따라 'text_data'파일을 열기 위해 상대경로를 '00_data/text_data.txt' 로 지정하여 3번째 사진 처럼 실행을 했는데 파일위치가 존재하지 않는다고 뜹니다. 제가 뭔갈 착각하고 있는 건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
6분 55초 구문
여기서 왜 꼭 aggregate를 써야 하나요? 열을 지정하지 않고 그냥 groupby다음에 .count()하고 나중에 골라내도 상관없는 것 아닌가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
최종정리 코드에 관하여 문의드립니다.
정리 강의라서 시간대를 말씀드리기가 애매한데요, 우선 정리해주신 코드 중에 첫번째에 각각 파일에 대해 작업할 때에 int64로 정수형으로 정리될 수 있도록 작성되어있습니다. 그런데 세 번째 코드로 가시면 보시는 것 처럼 다시 최종 파일 다루는 과정에서 다시 int64 를 적용하는데요, 실제로 저 단계 바로 직전에서 df_confirmed를 실행해보면 소숫점 데이터 값들이 나와있습니다. 왜 첫번째 코드에서 int64를 명시했는데, 다시 int64를 적용해야하는 상황이 나오는건가요?? 번거로우실텐데 죄송합니다..
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
10분 부분 질문드립니다.
안녕하세요 매번 질문드려ㅜ죄송합니다 ㅠㅠ doc_final_country = doc_final_country[cols] 문법이 어떻게 작용하는 거죠? 뜻하는 바도 궁금합니다. 컬럼명을 바꿀때는 보통 프레임.columns = 리스트 로 한다고 배웟는데, 처음 보는 경우같아서 질문드립니다. 궁금해서ㅜ제가 따로 데이터프레임을 만들고, 리스트를 만들어어서 동일하게 대입해봤을때는 에러가 뜨네요...
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
시작부분 구문에서 질문입니다!
orders에는 dropna를 하고 왜 payments에는 dropna를 안해주는 건가요?? 왜 한 쪽만 dropna를 해주는 건지 궁금합니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
안녕하세요 혹시 코로나 그래프에서 사용되는 국기 사진 웹사이트 접속이 잘 안되는 것인가요?
https://www.countryflags.io/ 여기에 접속이 안되는데, 사진은 parsing 하는데 괜찮을까요?