처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]대시보드
월 15,400원
5개월 할부 시다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
dynamic graph 관련 문의
선생님, 안녕하세요. matplotlib이나 sns같은 static한 자료는 ipynb 파일을 읽을 때, 바로 화면에 나타납니다만, iplot과 같은 dynamic한 graph는 제가 파일을 run해야지만 그래프가 화면에 나타나네요. 그래서 파일을 읽을 때마다, 파일을 run해야하는 번거로움이 있습니다. 위와 같은 문제를 어떻게 해결할 수 있을까요? 고맙습니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
질문 드립니다
6분 11초에서 isnull().sum() 하면 iso2에서 4개가 찾아진다고 강의에는 나와있는데 실제로 강사님이 주신 데이터속에서는 9개가 찾아집니다 어떻게 된것인가요?? ㅜㅜ
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
지난 질문에 대한 재질문 드립니다!
left merge 관련하여 질문드렸었는데 더 구체화해서 재질문하겠습니다! 이렇게 해당 dataframe은 doc 이라는 변수에 할당했습니다 그리고 이렇게 country_info 도 가져왔습니다 위 dataframe 두개를 left merge 한 자료입니다. 강사님 강의 자료에서 그대로 캡처해왔습니다! test_df = pd.merge(doc, country_info, how='left', on='Country_Region') 이렇게 되면 왼쪽 테이블과 오른쪽 테이블 모두의 컬럼을 가져오는 것은 이해했습니다. 이렇게 left merge 식을 쓰면 왼쪽 테이블에 있는 정보는 모두 다 가져오고 오른쪽 테이블에서는 기준이 되는 컬럼 즉, 여기서는 Country_Region 의 컬럼값이 왼쪽과 같은 행만 가져오는것으로 알고 있습니다 그렇게 되면 doc을 출력해보면 총 37행이고 country_info를 출력해보면 3000행을 넘어가던데 두 merge 값인 test_df 가 어떻게 3332행이 나올 수 있는 건가요? 왼쪽에 맞춰야하면 기본적으로 왼쪽 테이블의 모든 값을 다 가져오고 이에 겹치는 오른쪽 행들이 있다해도 37줄이 나와야 하는게 아닌가요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
country_info 질문!
해당 강의에서 country_info 테이블과 01월22일 코로나 현황 테이블을 left merge 했는데 그렇다면 좌측에 둔 01월 22일 코로나 현황의 컬럼들과 겹치는 컬럼들만 나와야 하는거 같은데 결과값에서 country_info 컬럼 전부가 나오는 이유가 궁금합니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
가설 검정과 EDA의 차이점
안녕하세요! 본 강의에서 가설 검정 대신 EDA를 많이 쓴다고 이해했습니다. 그런데 데이터의 크기는 결국 CLT와 연관되고, EDA의 기본 시작할 때 가정을 하는 양상을 보였는데 가설 검정과 무슨 차이가 있는 것인가요??
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일 생성 읽어오기 수정 등
파이썬 입문과 크롤링 수업에서는 openpyxl 라이브러리를 사용해서 excel 파일을 만들거나 읽어오기를 배웠습니다. 현재 하고 있는 이 부분과 차이가 있나요? 라이브러리를 import 하고 안하고와 사용방법을 제외하고 두 방법에 저장 파일 형식의 차이, 효율성 등 비교를 해주실수 있을까요??? 추후 배운 내용에서는 excel 형태는 CSV가 적합한 것으로 이해했는데 데이터 포맷 타입이 CSV이든 , XML 이든 엑셀 파일로 변환이 가능한 것인가요???
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
axis 질문 드립니다.
강사님 안녕하세요. 데이터프레임에 신규 컬럼 추가하기 (8:15) 질문 드립니다. def create_flag_link(row): flag_link = 'https://www.countryflags.io/' + row + '/flat/64.png' return flag_link doc_final_country['iso2'] = doc_final_country['iso2'].apply(create_flag_link) 에서 apply 괄호 안에 axis=1이 들어가야 하지 않나요?? 국가별로 행이 인자로 들어가고 그 중 iso2 칼럼값만 바꾸는거니까요. 지난 강좌 "pandas 라이브러리로 실제 데이터 전처리하기2" (5:10) 에서도 doc = doc.apply(func, axis=1) 을 적용하신 것 처럼요. apply 는 특정 행/열값만 바꾸니까 늘 axis가 따라다닌다고 생각했는데 제가 잘못 이해한건지요?? 도움 부탁드리겠습니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일 병합 질문 드립니다
강사님 안녕하세요. 마지막에 파일 병합하는 코드 질문 드립니다. (강의 9:15) first_doc = True for file in csv_list: doc = create_dateframe(file) if first_doc: final_doc, first_doc = doc, False else: final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True) "first_doc=True면 첫 프레임을 지금 프레임으로 만들고, first_doc이 채워졌으니 False로 만든다. 이후 final_doc이 기본 프레임이 된다."고 말씀하셨는데 이해가 안되서요. 아니 if first_doc: final_doc, first_doc = doc, False 의 문법 자체를 모르겠습니다 ㅠㅠ 이건 어떤 원리로 작성된 코드인지요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
용어 관련
선생님, 강의 중간중간에 아이템이라는 용어를 사용하시는데, 아이템은 무엇이라고 생각하면 되는 건가요? 데이터, object, 객체, 아이템.. 등의 용어가 살짝 헷갈리네요. 답변에 미리 감사드립니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
파일디스크립터 관련
선생님, 안녕하세요. 파일디스크립터가 무엇인가요? 선생님의 강의도 2차례 돌려보았고, 구글링을 해서 파일디스크립터가 무엇인지 확인도 해보았으나, 아직 잘 모르겠습니다. 좋은 강의 항상 고맙습니다. 행복한 주말 되시길 바라겠습니다.
- 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
iplot을 이용한 scatter그래프 그리기
삭제된 글입니다
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
개념 질문 드립니다
강사님 안녕하세요. 문제풀이 코드 마지막에 for items in datas1: print(item['data']) 에서, item['data'] 의 원리를 확인하고 싶은데 어떤 개념인지 도저히 찾을 수가 없어서요 ㅠㅠ suggestion data='스마트폰' 이니까 딕셔너리도 아니고 슬라이싱도 아니고... 어떤 개념을 봐야할지 알려주시면 감사하겠습니다!
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
안녕하세요. 질문입니다.
강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다. 안녕하세요. 제가 잔재미코딩님 강의는 다 샀는데 셀리니움 과목과 이 과목을 들으면 웹 개발에 이용 할 수 있을지 궁금합니다. 제가 웹개발이 목표고 다른 커리큘럼인 웹개발은 다 결제해서 들었는데 이 데이터 처리 과목과 셀레니움이 웹 개발 및 개발자들에게 도움이 될지 아니면 잔재미코딩님의 풀스택 개발자 커리큘럼만 들어도 충분한지 궁금해서 질문드립니다. 그리고 자바를 주로 이용하는 개발에도 이용이 가능한지(연동이라던가) 도 궁금합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
doc3 = doc2[doc2['customer_city' == 'sao paulo']
(강의 - 지금까지 익힌 pandas 연습문제로 익숙해지기1 / 7분 21초 경) doc2에서 customer_city가 sao paulo인 행 가져오기에서 doc3 = doc2['customer_city'] =='sao paulo' 라고 하지 않고 doc3 = doc2[doc2['customer_city'] == 'sao paulo] 하는 이유가 뭔가요? + doc2 = doc[['customer_zip_code_prefix', 'customer_city', 'customer_state']].copy() 에서 처럼 대괄호가 두 번 들어가는 이유가 궁금합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
데이터 질문
선생님, 수업을 위해 마련해주신 csv 파일들은 크롤링을 통해서 수집한 데이터가 아니라 개인적으로 공유받으신 데이터죠? (이런 규모나 질의 정보들도 크롤링을 통해 수집이 가능한가요?ㅎ)
- 해결됨처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
시리즈 데이터 추가
안녕하세요, 강사님 del seriesdata['미술'] 을 한 다음 (insert나 append 처럼) 다시 미술을 추가할 수는 없나요? 감사합니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
강의명 : pandas 라이브러리로 실제 데이터 전처리하기2
상기와 같이 설명하셨는데(강의에선 Change를 row로 표현했지만 임의로 바꿈, 이것은 단지 선언하는 함수명), 하기와 같이 작업했을 때는 json_data에 맞춰 지정한 국가명으로 변경이 불가한 이유를 알고 싶습니다. 저는 하기와 같이 코드를 형성해도 output은 동일할 것이라 생각했습니다.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
머신러닝/인공지능 기본
선생님, 머신러닝/인공지능 기본 강의는 언제쯤 출시(?)예정이신가요?ㅎㅎ 정확하진 않겠지만 대략적으로라도 알려주심 감사하겠습니다. 기다리려구요.
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
plotly 레이아웃 업데이트
(디테일하고 가장 예쁜 시각화 라이브러리 사용법 이해 2, 8분 10초 쯤) 여기서 보면 레이아웃을 업데이트할 때 fig.update_layout( { "title": { "text": "Graph with <b>go.Bar</b>", "x": 0.5, "y": 0.9, "font": { "size": 20 라고 하여 title 안에 사전형태로 text를 지정해주는데 "xaxis": { "title": "random number", "showticklabels":True, "dtick": 1 X축에 대한 내용을 업데이트 할 때는 title 안에 사전 형태로 text를 추가로 작성하지 않고 바로 들어갈 내용을 적는 차이가 있는 이유가 있나요?
- 미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
final_code 두번째항 질문..
import os def generate_dateframe_by_path(PATH): file_list, csv_list = os.listdir(PATH), list() first_doc = True for file in file_list: if file.split(".")[-1] == 'csv': csv_list.append(file) csv_list.sort() for file in csv_list: doc = create_dateframe(file) if first_doc: final_doc, first_doc = doc, False else: final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True) # 위 구문 질문입니다. 여기서 if랑 else 를 굳이 쓰지 않고 바로 doc = pd.meger( ......) 을 선언하면 문제가 되는건가요? 궁금합니다. (파이널코드 주피터파일의 두번째 칸입니다) final_doc = final_doc.fillna(0) return final_doc