66,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
결측치 그래프_heatmap으로 그릴 때
선생님 y축의 숫자들은 index 값을 의미하는 건가요~? 그 인덱스 위치에 결측치가 존재한다는 걸 보여주기 위한건가요..~?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
missingno
선생님~ missingno 라이브러리는 주요기능이 결측치를 시각화하는 그래프 그리는 기능이라고 이해하면 될까요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
profiling 오류
선생님 이렇게 오류가 나네요.. 다른 질문 답변 보고.. 위에 import matplotlib matplotlib.font_manager._rebuild() plt.rc("font", family="Malgun Gothic") 이 코드를 실행했는데도..오류납니다..ㅠ 어떻게 해야 하나요...?ㅠ (profiling 버전 2.10.0 입니다. )
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
reset_index() 컬럼명이 인데스로 가는 이유
reset_index() 를 하게 되면 인덱스가 다 컬럼으로 가게 되는 거로 이해하고 있었는데.. 브랜드명은 pivot에서 컬럼으로 지정해주었던 것인데.. reset_index() 를 하니깐 왜 index 이름으로 가게 되는 건가요? 이유가 무엇인가요? 그리고 index 이름으로 가지 않게 하려면 어떻게 해야 하나요? 강의에서는 그냥 넘어가신다고 하셔서요.. 설명 부탁드릴게요 ㅠ!!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
선생님 choropleth 매핑할 때 key_on과 매핑하는 컬럼
folium.Choropleth( geo_data=ge_json, name="choropleth", data=df_star, columns=["구", "매장수"], key_on="feature.properties.name", fill_color="YlGn", fill_opacity=0.7, line_opacity=0.2, legend_name="Unemployment Rate (%)", ).add_to(m) 이 구문에서 df_star의 칼럼 '구'와 geo_json의 key_on이 매핑되는 것이지요..? columns의 리스트의 첫번째 컬럼은 key_on과 매핑되는 값, 그리고 두번째 컬럼은 색상의 분포로 나타낼 수치형 칼럼을 넣으면 되는 것인가요? 이부분에 대해 자세한 설명이 없어서요..ㅠ 답변 부탁드립니다..
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
github에 올려둘때 .ipynb 확장자 미리보기
강의 하나하나 정리하며, github에 올리려는데, .ipynb 확장자는 미리보기가 안되네요... 선생님 github에서는 미리보기가 되는데 말이죠... 그냥 save된 파일을 올리면 안되고 파일형식을 변형해서 올려야하나요??
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
확인차 질문드려요~
df_last[df_last["전용면적"] == "전체"] df_last[df_last["전용면적"] == "전체"][cols] 이 내용을 df_last.loc[df_last["전용면적"] == "전체"] df_last.loc[df_last["전용면적"] == "전체", cols] 이렇게 써도 같은 결과 값이 나오는데, 둘을 혼용하여 사용해도 상관이 없는것인가요?? 실제로 여러 프로잭트를 하시다 보면 둘중 어느것을 더 많이 사용하게 되나요? 코더가 익숙한것을 고르면 되는것이가요??
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
공부방법질문
안녕하세요 강의를 듣다가 문득 궁금한점이있어서 질문드립니다현재 강의잘듣고있는데요 사실 강의내용이 알차서 그런지 배우고 알아야할개념이 많은거같습니다.. 문득 궁금한게 제가 만약 실제 데이터분석을 할일이있으면 여기에 있는 개념들을 이용해서 제가 필요한 부분을 골라서 데이터분석에 응용할텐데 이럴경우 제가 강사님이 강의해주신 부분을 참고하거나 혹은 공식문서같은걸 보고 데이터분석을 하는건가요? 솔직히 여기있는걸 전부 암기해서 하는건 좀아닌거같고... 실제 강사님이만약 실제 데이터분석같은걸 할때 지금 강의하신내용을 전부 안보고 하시는지 궁금합니다. 아니면 강사님도 필요한부분을 구글링이나 공식문서보고 자기상황에 맞게 수정하는식으로 데이터분석하시나요?? 마지막으로 사실 데이터분석이나 개발을 할때 공식문서를 보는게 거의 필수라는데 강사님은 공식문서를 어떤식으로 이용하시는지 궁금합니다
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
Heatmap그릴 때
Heatmap에서는 파리바게뜨와 뚜레쥬르 구분이 안되는데.. heat = df_bread[['위도','경도','브랜드명']].copy()heat['브랜드명'] = heat['브랜드명'].replace('뚜레쥬르', 1).replace('파리바게뜨',2)heat = heat.values heat 데이터 만들 때, 2차원 배열 형태로 바꿔주면서 '브랜드명'을 넣는 이유는 무엇인가요..? Heatmap에서는 파리바게뜨와 뚜레쥬르 구분이 안되는데.. '브랜드명'을 넣어서 만드는 이유가 무엇인지 궁금합니다. 그리고 9:00~9:06 쯤에 "'브랜드명'의 숫자가 많고 적음을 의미하기 때문에 replace로 파리바게뜨와 뚜레쥬르 각각 1로 쓰는게 맞다"고 하시는데 .. 처음에 구분하시는 것처럼 1, 2로 하셨다가..다시 저렇게 설명하셔서.. 이해가 잘 안되네요..ㅠ 더 자세히 설명 부탁드려요.. 답변 부탁드립니다..
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
seaborn 그래프 범례
안녕하세요? 다음과 같이 그래프 겹쳐 그리기를 하고 범례를 표시하려고 legend()함수를 사용했습니다. 실행결과 그래프는 그려지는데 "No handles with labels found to put in legend."라는 메시지와 함께 범례 표시는 되지 않습니다. 이를 해결하려면 어떻게 해야 할까요? oriental = df.loc[(df['한방지급여부']==1)&(df['통원기간']<=200), '피해자과실상계율'] non_oriental = df.loc[(df['한방지급여부']==2)&(df['통원기간']<=200), '피해자과실상계율'] sns.kdeplot(oriental) sns.kdeplot(non_oriental) legend()
- 해결됨공공데이터로 파이썬 데이터 분석 시작하기
html 생성후, output오류
판다스 프로파일링 실행후, html파일을 새로 생성하여 리포트를 보았습니다. 하지만 interaction, correlations, missing values는 한글폰트가 나오지 않거나 아예 결과값이 뜨지 않습니다. 하지만 이 외의 sample이나 overview같은 것들은 모두 한글이 잘 보입니다. 혹시 어떤 부분에서오류가 나서 그런지, 해결방법 알려주실 수 있으신가요? 답변 미리 감사드립니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
선생님 파리바게뜨 브랜드명 만들어줄때
선생님~ "브랜드명"을 만들어줄 때 처음에 파리바게뜨 먼저 했는데요~ 강의(10:17)에서는 df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨" 이렇게 했는데.. df_bread.loc[df_bread["상호명"].str.contains("파리(바게|크라상)"), "브랜드명"] = "파리바게뜨" 이렇게 해야 하지 않나요..?! "상호명" 컬럼 확인해보면 파리크라상도 있어서요.. 강의에서 df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨" 이렇게 하시고 바로 df_bread["브랜드명"] = df_bread["브랜드명"].fillna("뚜레쥬르") 이렇게 하게되면.. '파리크라상'인 "상호명"들도 '뚜레쥬르'로 되지 않나요..?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
판다스에서 hue같은 기능
선생님 강의에서 scatterplot 그릴때 seaborn에서 hue 기능을 쓰면 색상구분이 더쉽다고 하시면서 판다스에서도 가능하긴 하다고 하셨는데(7:23~7:26).. 판다스에서는 위의 코드에서 어떻게 하면 브랜드별로 다른색상으로 점을 찍을 수 있나요..?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
그래프 text 표시
위의 그래프에도 text를 표시하고 싶어서 한번 이렇게 시도 해봤는데.. text들이 옆으로 가네요..ㅠ 선생님께서는 이 그래프에서 text 넣으신다고 하신다면.. 어떻게 코드를 작성하실지 궁금합니다..! 조언 부탁드립니다.. 그리고 text표시가 저렇게 되면 어떻게 해야 하는지도 궁금하네요..
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
그래프 text 기능 자세한 설명
선생님~ 그래프 그리고 text 기능을 이번 강의에서 처음 설명해주시는 것 같은데.. 여기서 x, y, s는 무엇이고 그래프에서 어떤 것을 표시해주는 건지 설명이 없고..ㅠ 그냥 "g.text에 x=0, y=brand_count[0], s=brand_count[0]을 넣으시면 되는데요~" 이렇게 설명하시면..조금 이해가 어려운 것 같아요..ㅠ 이걸 써서 달라진 점은 막대 위에 빈도수표시되는 것인데.. "x는 무엇때문에 0을 넣고, y는 무엇때문에 brand_count[0] 을 넣고.... " <-이러한 설명이 필요할 것 같아요.. 지금 y와 s에 넣는 값이 똑같은데..막대 위에 표시된 464는 y때문에 표시된 건지.. s때문에 표시된건지.. 모르겠어요.. 자세한 설명 부탁드립니다..ㅠ!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
json 파일 시각화
안녕하세요 선생님 수업을 듣고 응용해서 연습하고있습니다. 쉽게 이해하실 수 있도록 전체 소스 첨부할께요 ㅠㅠ 해당 소스에서 에러가 없다가 마지막에 viz.show()를 하는 순간 TemplateNotFound: choropleth.html 라는 메시지가 뜨는데 어떻게 해결해야할까요....많이 검색해봤지만 명확한 해결이 하지못해서 3일째 고생중입니다 ㅜㅜ 자세하게 설명 부탁드려도 될까요 ㅠㅠㅠ json파일이 문제가 있는거일까요? 아니면 설치가 안된부분이 있거나 한건가요.....
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
groupby와 pivot_table에 대해 질문이 있습니다.
index에 "전용면적", "지역명" 을 넣고 .unstack() 을 넣고 groupby를 하면 dataframe 형식으로 즉, piviot_table 과 같이 나온다는 것을 이해를 했습니다. 하지만 index가 "지역명" 하나라면 .unstack()을 했을 때 오류가 나는데 꼭 인덱스가 두개여야 unstack 함수를 쓸 수 있는것인가요?? 그리고 만약 인덱스가 하나인 groupby 형식에서 dataframe 형식으로 바꾸고 싶다면 어떻게 해야하나요 .. 따로 함수가 없고 이때 써야하는게 pivot_table인가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
엑셀파일
선생님 강의 10:10-23쯤에서 df_seoul.to_csv("seoul_open_store.csv")로 엑셀파일을 만들었는데 주피터노트북에서는 한글이 잘 보이는데, 따로 엑셀파일로 열어보면..한글이 깨져있는 이유는 무엇인가요..?ㅠ 어떻게 해야 엑셀파일을 한글로 안깨지고 볼 수 있나요..?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
안녕하세요 선생님
혹시 같이 하는내용들을 제 네이버 블로그에 복습 용도로 게시해도 되나요??
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
isin만 가능한지 궁금합니다.
선생님 plt.figure(figsize=(10,7)) sns.scatterplot(data=df_academy_selected[df_academy_selected["상권업종소분류명"]==["어린이집", "학원-입시"]] , x="경도", y="위도", hue="상권업종소분류명") 이렇게 코드를 쓰면 왜 오류가 나는 걸까요..? '=='과 같은 연산자에서는 값이 하나만 넣어야 되는 건가요? 리스트로 넣으면 안되나요..? 'isin() '을 사용해서 ()안에 리스트로 넣어주는 건 되는데.. 위에 코드처럼 쓸때에는 리스트를 쓰면 안되는 이유는 무엇인가요 ?