처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
4분 drop_duplicates 질문드립니다
혼자서 데이터를 파헤쳐보며 연습하고 있는데요,keep='last'조건을 주신거에대한 반례가 있는것 같아서 질문드립니다. 다음과 같이 US는 굉장히 많은 iso2들이 있습니다.이 경우는 운좋게 keep='last' 적용했을 때 US로 출력됩니다. 하지만 이 경우에는 덴마크에 대한 iso2(아마 지역구 별로 다르게 입력됐었던 것 같습니다) 는 덴마크의 keep='last'로 다뤘을때 옳은 값인 DK가 아닌 GL로 출력되게 되는데요. 이런 현상에 대해서 전체적으로 keep='last'를 적용하는게 맞나 싶어서 질문드립니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
2분30초 부분 질문
doc['Country_Region'] = doc.apply(country_name_convert, axis=1) 이 코드가 왜 doc = doc.apply(country_name_convert, axis=1) 이게 아니라 컬럼을 지정해서 적용해야하는지 이해가 가질 않습니다. 어차피 country_name_convert 함수에서는 column에만 작용하고, column에 한에서 수정이 들어가게 만들어졌는데 왜doc=가 아닌doc['Country_Region']=이렇게 식이 지정되어야하는지 모르겠습니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
try, except 질문있습니다!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 해당 강의에서 특정 column만 선택해서 데이터프레임을 만드는 것을 공부하는 중입니다. 강의 중 import pandas as pd data = pd.read_csv('abc.csv', encoding = 'utf-8-sig', error_bad_lines = False) try: data = data[['id', 'level']] except: data = data[['id', 'id_level']] data.columns = ['id', 'level'] 이 처럼 try except를 사용하여 해결하였는데, 만약 raw data의 같은 의미의column 종류가 여러 형태로 되어있다면 아래와 같은 형식을 써도 문제가 안 되는지를 여쭙고 싶습니다! try: A except: try: B except: try: C except: D A를 실행하고 ERROR가 나면 B 실행, ERROR나면 C실행 . . . 이렇게 하면 문제점이 있을까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
제이슨
Country_Region에 Mainland China를 China로 바꿔주는 부분에서 jason형태로 변환하지 않고 넘파이로 변환한 다음에 for문을 돌려서 바꿔주는 부분은 안되는건가여 ?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
마지막 3번 문항 (파일 읽고 출력하기)
안녕하세요. 마지막 문항을 푸는데 계속 오류 메시지가 뜹니다. data_file=open('00_data/text_data_practice.txt','r',encoding='utf-8-sig') data = data_file.read('유치원\n') data = data_file.read('초등학교\n') data = data_file.read('중학교\n') data = data_file.read('회사\n') data_file.close() 혹시 어디부분이 잘못된걸까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
학습자료파일 관련 질문드립니다.
혹시 학습자료폴더에서 DaveLee_20200810의 하위폴더인 __MACOSX 안에 있는 00_Material(Uploaded) 폴더와 DaveLee_20200810 폴더의 바로 하위폴더인 00_Material(Uploaded)는 어떤 차이가 있는건가요? 용량이나 세부적인 파일이 조금 다른것같긴한데 어떤점이 다른건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일 경로 지정 (파이썬으로 Plain Text 포맷 파일 다루기) //'파이썬에서의 파일처리를 위한 기본지식 강의' 15분 50초경
안녕하세요, 선생님. 질문하나만 드립니다. 학습자료 파일들의 경우 열고싶은 파일 (여기서는 text_data.txt 라는 파일)이 주피터노트북상에 저장돼있을 필요는 없고 'open' 명령을 입력하면 주피터노트북이 알아서 지정한 경로에따라 컴퓨터에 저장되어있는 파일을 불러와주는 원리인거죠? 또한 그렇다면 왜 다음과 같이 했는데 안되는지 봐주실 수 있나요? '파이썬에서의 파일처리를 위한 기본지식 강의' 15분 50초경에서처럼 강의에서와 똑같이'00_Material(Uploaded)' 라는 폴더에 위치한 ' plaintext_file_format '라는 강의자료 파일을 주피터 노트북에 불러왔고 그 파일안에서 open을 실행하였는데 에러가뜹니다. 사진1,2에서 보시다시피 이 ' plaintext_file_format ' 라는강의자료 파일이 '00_Material(Uploaded)'라는 폴더에 저장되어 있고 같은 폴더(즉, '00_Material(Uploaded)' )안에 '00_data'폴더가 위치해있으며 그 '00_data' 폴더 안에 'text_data' 라는 파일이 있다는것을 확인 하였고,그에 따라 'text_data'파일을 열기 위해 상대경로를 '00_data/text_data.txt' 로 지정하여 3번째 사진 처럼 실행을 했는데 파일위치가 존재하지 않는다고 뜹니다. 제가 뭔갈 착각하고 있는 건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
6분 55초 구문
여기서 왜 꼭 aggregate를 써야 하나요? 열을 지정하지 않고 그냥 groupby다음에 .count()하고 나중에 골라내도 상관없는 것 아닌가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
최종정리 코드에 관하여 문의드립니다.
정리 강의라서 시간대를 말씀드리기가 애매한데요, 우선 정리해주신 코드 중에 첫번째에 각각 파일에 대해 작업할 때에 int64로 정수형으로 정리될 수 있도록 작성되어있습니다. 그런데 세 번째 코드로 가시면 보시는 것 처럼 다시 최종 파일 다루는 과정에서 다시 int64 를 적용하는데요, 실제로 저 단계 바로 직전에서 df_confirmed를 실행해보면 소숫점 데이터 값들이 나와있습니다. 왜 첫번째 코드에서 int64를 명시했는데, 다시 int64를 적용해야하는 상황이 나오는건가요?? 번거로우실텐데 죄송합니다..
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
10분 부분 질문드립니다.
안녕하세요 매번 질문드려ㅜ죄송합니다 ㅠㅠ doc_final_country = doc_final_country[cols] 문법이 어떻게 작용하는 거죠? 뜻하는 바도 궁금합니다. 컬럼명을 바꿀때는 보통 프레임.columns = 리스트 로 한다고 배웟는데, 처음 보는 경우같아서 질문드립니다. 궁금해서ㅜ제가 따로 데이터프레임을 만들고, 리스트를 만들어어서 동일하게 대입해봤을때는 에러가 뜨네요...
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
시작부분 구문에서 질문입니다!
orders에는 dropna를 하고 왜 payments에는 dropna를 안해주는 건가요?? 왜 한 쪽만 dropna를 해주는 건지 궁금합니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
안녕하세요 혹시 코로나 그래프에서 사용되는 국기 사진 웹사이트 접속이 잘 안되는 것인가요?
https://www.countryflags.io/ 여기에 접속이 안되는데, 사진은 parsing 하는데 괜찮을까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
8분 부분 질문
def create_flag_link(row)에서 (row)가 어떻게 나오게 된건지, 어떤 효력을 가져서 row가 국가 코드2자리로 입력되는지 모르겠네요 ㅠㅠ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
9분 30초대에 나오는 first_doc에 관하여
안녕하세요! 9분 30 에 나오는 first_doc =True의 의미를 모르겠습니다... 뒤에 조건문에서도 쓰이는 의미를 파악 못하겠는데 True가 갖는 효력이 있는건가요? 아니면 다른 것으로 대체할 수도 있는건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
최종 전치리 데이터로 그래프 만들기1 - 3분 20초 쯤 질문입니다.
이 country_info = pd.read_csv("COVID-19-master/csse_covid_19_data/UID_ISO_FIPS_LookUp_Table.csv", encoding='utf-8-sig', keep_default_na=False, na_values='') country_info.head() 작업 전에, country_info[country_info['Country_Region'] == 'Namibia']로 확인을 해보았습니다. 아무 것도 하지 않은 상태에서 확인 했을 때도, Namibia의 ios2는 NA 인데요. 다른 ios3 등 다른 모든 열의 정보가 그렇기 때문에, country_info = pd.read_csv("COVID-19-master/csse_covid_19_data/UID_ISO_FIPS_LookUp_Table.csv", encoding='utf-8-sig', keep_default_na=False, na_values='') 으로 인해 무엇이 변경 되었는지 이해가 되지 않고 와닿지가 않습니다. 또한, na_values=' ' 로 설정했다면 Namibia 의 ios2의 값은 공란이어야 하는 것 아닌가요? 영상 설명이 조금 짧은 듯 하여, 부가 설명을 부탁 드리고자 합니다! 항상 감사합니다:)
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
현재 annaconda에 파이썬 3.8설치 밖에 없습니다.
수업영상에서 보이는 파이썬 설치에서 종류가 3.7이라고 나오는데, 홈페이지 들어가서 보시면 현재 3.8 밖에 안 나와있습니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
컬럼 리스트로 변경
안녕하세요 선생님! 9분쯤에 컬럼순서 바꾸려고 리스트해서 하는건 이해하고, value값도 변하지 않는거 까지는 알겠습니다! 근데 iso2를 삭제하고 1번자리에 다시 넣었는데 value값도 그대로 온거면 value값은 iso2라는 컬럼에저장되어있기에 자동으로 오는건가요? 그래서 cols.insest(1, 'iso2') 해야 iso2값이 그래도 오지 여기서 컬럼명을 바꾸고싶다고 다른걸 넣으면 value값은 안따라오는건가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
.iplot 그래프가 보이지 않습니다 ㅠㅠ
선생님, 안녕하세요! 제가 좋은 컴퓨터 제원이 없다보니, jupyter notebook은 사용하지 않고 코랩을 사용하고 있습니다. 혹시 코랩에서는 plotly는 아예 사용이 불가능 한건가요?? 동일하게 실행을하면 오류는 나오지 않고, 빈 칸만 보입니다.. 미리 감사드립니다~!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
json.dumps()내용을 보다가, 딕셔너리형에 대해 혼란이 생겼습니다ㅜㅜ
딕셔너리 형(JSON 타입)을,{ "id":"01", "language": {"Java":"basic", "Java":"advance"}, "edition": "third", "author": "Herbert Schildt" }json.dumps() 를 통해, 문자열 데이터로 변환하는 것이라고 하셨는데요,print 값에는 전혀 변화가 없어 보입니다.("Java":"basic"이 출력 되지 않는 이슈는 이전 질문 내용을 통해 확인 했습니다.) 완전히 동일한 값이 출력됐고, 끝에 <class 'str'> 라고 타입명만 더 붙어 있는 것 말고는 차이가 없네요ㅠㅠ {"id": "01", "language": {"Java": "advance"}, "edition": "third", "author": "Herbert Schildt"} <class 'str'>도대체 뭐가 바뀐 것인가요? {key:value}는 딕셔너리로 알고있는데, 문자열이라니 헷갈립니다. json.loads()는 완벽하게 이해가 되지만, json.dumps() 예제가 어렵습니다. 다른 경우나, 다른 예제에서는 구분이 되는 것일까요?파이썬 기초는 배웠습니다... 혹시 뭔가 더 있나 싶어 자바스크립트 JSON 개념도 살펴봤지만 모르겠습니다.조금만 도와주실 수 있으실까요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
경로지정을 했는데 디렉토리를 찾을수 없다고 하여 문의드립니다.
안녕하세요. 수업자료를 다운받아서 00_data/text_data.txt를 불러들이면 읽을수 없는 디렉토리라고 응답이 되어서 혹시 저장을 c드라이브에 하였는데 이렇게 하면 안되는것인지 왜 파일을 찾지 못하는지 좀 알려주세요 ㅜㅜ