66,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨공공데이터로 파이썬 데이터 분석 시작하기
',' 구분자 제거하고 파일읽기 문의
처음에 파일을 읽을때 ' , ' 를 제거하는 방법이 있나요? 분양가격(㎡) 컬럼에 콤마가 있어서 판다 결과랑 엑셀에서 직접 확인한 결과랑, 갯수 차이가 있어서 제가 뭘 잘못한줄 알았습니다. 엑셀상에서는 "분양가격(㎡)" 의 숫자인 row를 count가 4033 로 확인됩니다. 함수 몇가지 사용해서 계산했구요. 그래서 아래 옵션을 추가해서 판다를 실행하니, 엑셀과 판다 결과가 4033으로 같았습니다. df_last['분양가격'] = pd.to_numeric(df_last["분양가격(㎡)"].str.replace(',', ''), errors='coerce') 구글링에는 thousands = ',' 옵션으로 읽으라는데, 잘 안되더라구요, csv 파일 읽을때 콤마 제거하고 읽기 가능한지 답변 부탁드립니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
두개의 데이터 셋을 합친 것을 저장해서 csv로 만들수는 없나요?
최종 결과물인 합쳐진 데이터 셋을 코드를 입력해서 csv파일로 저장하는 방법은 없나요? 결국 전처리를 했는데 저장을 못하면 날아가 버려서 매번 할때마다 다시해야되는 번거로움을 해결하고 싶습니다 ㅠㅠ
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
피봇 테이블과 그룹바이의 차이점
피봇 테이블과 그룹바이의 차이점을 잘 모르겠습니다. 모양이 다르게 생겼는데 그 차이만 있는 건가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
[지정된 모듈을 찾을 수 없습니다.]라는 오류 코드 발생
안녕하세요, 선생님. 5번째 강의 듣기 전에 프로파일링, 워드클라우드를 설치했는데요. 이후 seaborn, matplotlib.pyplot를 임포트할 때 아래와 같은 오류 코드가 나타납니다. ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.구글에서 찾아보니 환경 변수를 추가해주라고 해서 했는데도 계속해서 같은 메시지가 나타나서 여쭤봅니다.확인 후 답변 부탁드립니다 ㅠㅠ!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
박스 그래프에 있는 동그라미의 의미
박스 그래프에서 나타나는 동그라미의 의미는 무엇을 뜻하는지 알고싶습니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
바 그래프와 라인 그래프 시각화할 때 생기는 테이블
바 그래프와 라인 그래프 시각화할 때 생기는 테이블을 없애는 방법이나 안 겹치게 배치하는 방법도 있나요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
선생님 isnull과 isna의 차이는 무엇인가요?
선생님 isnull과 isnan의 차이는 무엇인가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
fillna 를 하면 안되는거 아닌가요?
df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨" 가 아닌 df_bread.loc[df_bread["상호명"].str.contains("파리"), "브랜드명"] = "파리바게뜨" 로 하는 거아니면 fillna 로 채웠을 때 "파리크라상" 인 애들도 뚜레쥬르로 채워집니다. df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨" df_bread.loc[df_bread["상호명"].str.contains("뚜레"), "브랜드명"] = "뚜레쥬르" 이 두 개의 문장을 돌리고 df_bread["브랜드명"].isnull().value_counts() 을 했을 때 True 40 이라고 나오니까 파리크라상인 애들이 40개가 있다는 뜻 아닌가요? df_bread.loc[df_bread["상호명"].str.contains("파리"), "브랜드명"] = "파리바게뜨" df_bread.loc[df_bread["상호명"].str.contains("뚜레"), "브랜드명"] = "뚜레쥬르" 로 돌리고 df_bread["브랜드명"].isnull().value_counts() 하였을 때는 False 812 가 나왔습니다. True는 나오지 않았습니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
pandas_profiling report 한글 꺠짐
윈도우 사용자이고, 위의 그림처럼, padnas_profile에서 report 생성했을때 한글이 깨져 보입니다. padnas_profiling 버전은 2.8.0 입니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
전국 분양가격이 안열리네여 ㅠㅠ
(사진)
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
빨간색 단락은 무슨 말인가요??
(사진)
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
C 드라이브의 볼륨에는 이름이 없습니다. 볼륨 일련 번호: D29C-3561
이렇게 뜨는 이유를 모르겠습니다... 그리고 왜 저는 저렇게 복잡하게 입력해야 뜨는지 모르겠네요 ㅠㅠㅠ
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
왜 안되죠? 윈도우인데 따라해도 안되고 move로 변경해도 안되네여
(사진)
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
익스텐션
설치해도 창에 nbextensions 기능이 안나오는데 문제가 있는건가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
'상호명이 '파스쿠찌|잠바주스'가 아닌 것만 가져오세요.'에 궁금한 점이 있습니다.
안녕하세요, 선생님. 강의 잘 듣고 있습다. 복습하다 중간에 궁금한 점이 생겨 질문드립니다, 03_frainchise_eda_input 파일에서요. # "상권업종대분류명"이 "학문/교육"이 아닌 것만 가져옵니다. 에서는 아래처럼 작성을 하는 것으로 배웠습니다. df_bread = df_bread[df_bread['상권업종대분류명'] != '학문/교육'].copy() 그리고 아래의 문항 중 # 상호명이 '파스쿠찌|잠바주스'가 아닌 것만 가져오세요. 에서 df_bread[~df_bread['상호명'].str.contains('파스쿠찌|잠바주스')]로 알려주셨는데요. 이것의 shape을 찍어보면 (812, 12)가 오는데 아래처럼 df_bread[df_bread['상호명'] != '파스쿠찌|잠바주스']로 했을 때 는 (823, 12)로 row의 개수가 달라서 왜 다른지 궁금하여 문의드립니다. 저는 두 개의 row 개수가 같을 거라고 생각을 했는데 달라서 어떻게 다른 것인지 궁금합니다. 항상 좋은 강의 감사드립니다 :)
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
파일 경로 설정에 문제가 있는 것 같은데 잘 모르겠네요.
안녕하세요. 지금 강의를 따라 진행하고 있는데 계속해서 파일을 찾을 수 없다고 나옵니다. 아무래도 파일 경로 설정이 잘못된 것 같은데 어디가 잘못되었는지 전 잘 모르겠네요 ㅜㅜ 도와주세요 ㅜㅜ
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
혹시 데이터셋 파일위치를 어디에 설정하셨나요??..
제가 %ls data 구문을 실행했을때, 아래 사진처럼 에러가 발생해서 어떻게 해결해야할지 문의드립니다. 혹시나해서 data폴더를 jupyter_tutorial폴더안에도 넣어보고 실행했는데도 에러가 발생합니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
df_cafe_vs.columns 지정에 따른 그래프의 차이가 궁금합니다!
전 강좌에서 df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 지정을 하니df_cafe_vs.head()로 미리보기 할 때는 df_cafe_vs.columns=["구", "브랜드명", "매장수"]와차이가 없어 보였습니다. 하지만 sns.barplot(data=df_cafe_vs, x="구", y="매장수")로 barplot을 그리려고 하니df_cafe_vs.columns=[["구", "브랜드명", "매장수"]]로 컬럼명을 바꿨을 때는 오류가 생기고df_cafe_vs.columns=["구", "브랜드명", "매장수"]로 컬럼명을 바꿀 때는 오류가 생기지 않았습니다. 이 2가지의 차이가 궁금합니다! 어떤 의미가 있죠??
- 공공데이터로 파이썬 데이터 분석 시작하기
오류 질문이요
삭제된 글입니다
- 해결됨공공데이터로 파이썬 데이터 분석 시작하기
msno.matrix(df) 에서 MemoryError가 발생합니다.
에러는 밑의 코드와 같이 발생합니다ㅠㅠ 어떻게 해결해야하나요? --------------------------------------------------------------------------- MemoryError Traceback (most recent call last) <ipython-input-20-3884b1dd1443> in <module> ----> 1 msno.matrix(df) C:\ProgramData\Anaconda3\lib\site-packages\missingno\missingno.py in matrix(df, filter, n, p, sort, figsize, width_ratios, color, fontsize, labels, sparkline, inline, freq, ax) 41 # z is the color-mask array, g is a NxNx3 matrix. Apply the z color-mask to set the RGB of each pixel. 42 z = df.notnull().values ---> 43 g = np.zeros((height, width, 3)) 44 45 g[z < 0.5] = [1, 1, 1] MemoryError: