66,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
copy() 질문이 있습니다!
선생님 안녕하세요 수업을 듣는중에 서울만 barplot 을 그리기 위해 df["지역명"] == "서울" (지역명이 서울인것만) df_seoul 변수에 넣어주었는데요. 여기서 copy 를 쓰는이유가 강의에서는 명시적으로 하기위함이라고 설명해주셨는데, copy 를 쓰지 않아도 괜찮지 않나요? copy 를 쓰는 이유가 궁금합니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
결측치를 보는 이유가 궁금합니다.
선생님 안녕하세요 2015년 이전의 데이터를 df_first 로 담고 이 과정을 melt 로 녹이기 이전에 df_first.info() 를 통해 first data의 정보를 보고 결측치의 유무를 봐야하는 이유가 무엇인지 궁금합니다. 그냥 df_first_head 와 df_last의 head 만 보고 컬럼을 맞춰주어 비교하면 안되는것인지요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
aggfunc='count'
선생님 강의 잘 듣고 거의 마무리해가고 있습니다! 감사합니다 한가지 궁금한점이 aggfunc='count'의 기능이 가끔 헷갈려서 질문 드립니다 pd.pivot_table(df, index='시도', values='공원면적', aggfunc='count')라고 작성한 후에 나오는 결과값은 단순하게 공원 면적의 개수를 세어주는 건가요? 아니면 공원 면적의 종류의 개수를 세어주는 건가요? 가령 A시에 a, a, a, b, c로 공원 면적이 우연히 3개가 같다고 할때 aggfunc='count'는 5를 출력한다고 보면 되나요? 자꾸 머릿속으로 한국말로 '시도별 공원 면적의 개수'라고 생각하니까 a, b, c, 종류가 3개이므로 시도별 공원면적의 개수는 3이라고생각하게 되는데 전자가 맞는거죠?!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
def안쓰고
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 혹시 def 함수 안쓰고 한줄로 df_first_melt["연도"]를 나타내고 싶은데 어떻게 코드를 작성해야 할까요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
마지막에 reset_index() 하는 이유
안녕하세요, 항상 유익한 강의 감사드립니다. 이번 강의 마지막 부분에서 reset_index 처리는 왜해주는 건가요?? 멀티인덱스 데이터에서 보기 쉽도록 인덱스를 초기화 한다는 것은 알겠는데, 변수 g가 unstack 이나 transpose 같은 계산을 거쳐서 이걸 다 초기화 해주기 위해서 reset_index를 한 것이라고 이해하면 될까요?? 답변 부탁드립니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
상자그림 해석
선생님 안녕하세요. 상자그림 해석 관련해서 질문 드립니다. index 를 월로 설정하여서 상자그림의 폭을 나타내었는데요. 2019년에는 월간 분양가격의 폭이 굉장히 크다는것을 의미하고, 중앙값이 최대값에 가까운 것으로 보아, 2019년에는 분양가격이 전체적으로 높다는 구체적인 사실을 알 수있다. 반면, 2015년에는 최소값과 최대값의 폭이 작으므로 월간 평당분양가격이 고만고만 했다는것을 의미한다. 라고 해석하는것이 맞을까요? +추가질문 선그래프와 막대 그래프 에서는 행을 구성하는것이 index 이지만, 상자그림에서는 columns 에 해당하는 값이 행을 구성하는데요. index 값들은 상자그림에서 최소값 최대값 중앙값으로 상세하게 표현되기 때문에 상자그림에서 index 값은 상자그림으로 표현되는것이다.로 해석하는게 맞을까요?? 질문이 많네요 ㅜㅜ 확인해주시면 감사하겠습니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
강의내용 블로그정리
박조은 선생님 안녕하세요. 데이터분석에 관해 관심이 있어 수강 잘 하고 있는 학생입니다. 강의 들은것을 블로그에 정리하고 싶어서 강의 내용 일부를 캡쳐해서 정리하고 있는데 혹시 문제가 되거나 수정해야 할 사항이 있으면 말씀해주시면 감사하겠습니다. https://jaejun1210.tistory.com/7 박조은 선생님 강의, 링크, 공공데이터 포털을 올렸습니다. 혹시 문제가 생긴다면, 비공개로 처리하거나 수정하겠습니다..! 선생님 추가로 이렇게 블로그로 정리해서 공부하는 것은 처음인데, 아무래도 강의를 듣고, 따라서 해보고, 블로그로 정리까지 해버릇 하니 거의 한강의당 한시간 가까이 걸리는거 같은데... ㅜㅜ 이렇게 하는 방식이 괜찮을까요? 블로그 정리하는 것도 처음이고 코딩공부는 다른 공부와 다른거 같아서 처음인 부분이 많아서 의문이 많아서 질문드립니다. 감사합니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
pd.pivot_table
선생님 안녕하세요. pivot table 강의 듣는중에 질문이 생겼습니다. 데이터 그룹화를 위해서 pivot table을 사용한다고 했을때, 항상 pd.pivot_table 이라고 써주어야 하나요? 만약에 pandas 라이브러리를 aa 라고 했을때는, aa.pivot_table 이라고 표기해주어야 맞는것일까요? 만약 그렇다면 [판다스 라이브러리].pivot_table 이라고 해주어야 pivot_table을 사용할 수 있는건가요??
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
자동차 등록번호 마스킹
자동차 등록번호 마스킹할 때 질문 있습니다 32 가 1234 가 있을 때 '3*가1**4'로 표현하기 위해서 선생님께서 re.sub('([0-9])([가-힣])(\d)(\d{2})(\d)', r'*\2\3**\5', car_num)으로 작성하셨었는데요 처음에 작성하시는 과정에서 ([0-9])([가-힣])까지 쓰셨을때 이렇게 작성하면 문자 앞에 있는 숫자 한자리수가 변한다고 하셨었는데요 이게 어떻게 가능한건지 궁금합니다. 저는 sub메소드가 인식할때 (car_num이 32가1234라고 가정할 경우), ([0-9])는 가장 첫 숫자로 인식할 것이라고 생각했었는데요 정말로 실행해보니 한글 앞에 숫자인 2를 *로 바꾸더라구요 그래서 제가 이해한 바로는 ([0-9])([가-힣])(\d)(\d{2})(\d)' r'*\2\3**\5' 두 식 모두 번호판의 첫 자리 숫자인 3은 포함하지 않고 작성한 것 같다고 생각이 들었습니다. (가장 마지막 자리인 (\d)와 \5를 똑같이 지워도 같은 결과가 나왔는데 컴퓨터가 알아서 ([0-9])([가-힣])(\d)(\d{2})(\d)이 car_num과 일치하는 위치를 찾아서 바꿔주는건가요? 가령 여기서는 [가-힣]이 한글자밖에 없어서 그 위치를 기준으로 바꿔주는건가요??? 제가 따로 이렇게 기준을 알 수 없는 식인데 앞뒤를 생략한 re.sub식을 적어봤는데 그건 또 오류가 나던데 제가 이해한게 맞는지 궁금합니다 질문이 너무복잡한 것 같은데 정리하자면,, 1. re.sub을 작성할때 꼭 바꾸고자 하는 문자열을 다 커버하지 않아도 되는지 2. 다 커버하지 않더라도 문자열을 수정할 때의 기준점이 반드시 있어야 하는지 궁금합니다.
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
import numpy as pd
안녕하세요 커뮤니티에 있는 오류해결법을 보고 import numpy as np 로 np에 numpy 를 불러온 후에 pd.to_numeric(df_last["분양가격(m)"]) 을 하면 오류없이 잘 나오는 것을 확인했습니다. 그런데, import numpy as pd 로 pd 에 numpy 를 불러오게 되면, pd.to_numeric(df_last["분양가격(m)"]) 가 오류가 나오게 되던데, pd 에는 pandas 라이브러리가 있기 때문에 오류가 나는 것인가요? 만약 그렇다면, pandas 라이브러리가 있었던 파일에 다시 numpy 라이브러리를 넣는것인데 왜 오류가 나는지 궁금합니다. 또, np 와 pd 는 그냥 본인이 정해주는 변수 같은건가요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
구글 코랩에서 한글 폰트 설정
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 시각화 설정 부분에서 알려주신대로 했는데 안돼서 찾아봤는데 구글 코랩을 사용하시는 분들은 다르게 해야하더라구요! 주피터 노트북하고 거의 동일하다고 생각했는데 이 부분 추가해주시면 좋을 것 같습니다ㅎㅎ 저는 구글링 통해서 글꼴깔고 리빌드 하고 재시작 하는 방법으로 플롯의 네모가 한글로 정상적으로 나왔습니다
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
파일을 찾을 수 없다고 오류가 나옵니다
안녕하세요. 윈도우 OS 라서, data 파일을 따로 생성한 후에 엑셀파일들을 집어넣었구요. ls data 명령어를 사용하니 이렇게 나오는데.. 잘 들어간게 맞나요? 그리고 이렇게 파일을 찾을 수 없다고 오류가 나옵니다 ㅜㅜ 도와주세요
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
이번 강의에서 받은 data set 와 이전 강의에서 data 로 이동시킨 .csv 파일들이 같은 파일 아닌가요?
이번 강의에서 받은 data set 와 이전 강의에서 data 로 이동시킨 .csv 파일들이 같은 파일 아닌가요? OS가 Window 라서 폴더 탐색기를 이용하여 data 폴더를 만들고 그 안에 엑셀 파일 들을 이동시켜주었는데요. 이번 강의에서 다운받으신 두개의 파일이 data 파일 안에 들어있는 파일과 동일한 파일 아닌가요?? 추가로, data 파일을 저렇게 open-data-analysis~ 파일 안에 만들어주는게 맞나요??
- 해결됨공공데이터로 파이썬 데이터 분석 시작하기
fillna()
fillna() 안에 Series의 형태가 들어갔는데요, df['A']=df['A'].fillna(df['B'] ) 이때 저는 컴퓨터가 곧이곧대로 해석해서 df['A'] 시리즈 중에서 결측치가 있는 값에 시리즈 전체인 df['B']를 넣지 않을까 라고 생각했는데 신기하게도 행의 값을 주지 않아도 컴퓨터가 알아서 그 특정 행 값을 찾아서 넣더라구요..! 이게 신기한데 어떻게 이렇게 작동하는건가요? 구글링해서 찾아보니까 그냥 예제들만 수두룩하게 보이는데 그 작동 원리는 잘 모르겠어서 질문 드립니다..!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
선생님 질문있습니다
안녕하세요 항상 강의 잘듣고있습니다 새해복 많이 받으세요 :) 데이터 분석을 하다가 문득 data.columns 로 접근 하는 방식이 있고 data.isna() 이런식 으로 접근 하는 방식이 있잖아요? 즉 ()이 붙는 경우와 안붙는 경우로 나뉘는데 이게 도대체 뭘 뜻하는지 모르겠습니다. 자세히 알려주시면 감사하겠습니다 :)
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
choropleth 파라미터들
1. key_on을 설정할때 id값이 없다는 말씀이 어떤 말씀인지 잘 이해가 되지 않습니다 추가로 인터넷 찾아보면서 파라미터 중에 이해 안가는 두 가지 질문드립니다 2. key_on과 columns 파라미터가 어떻게 작동하는건지 잘 와닿지가 않습니다. 제가 이해한 바로는 data가 데이터 프레임 형태라면 반드시 key_on과 columns 파라미터를 넣어주어야 하는데 key_on 설명이 Variable in the `geo_data` GeoJSON file to bind the data to라고 되어있는 것을 보니 data파라미터와 geo_data 파라미터의 데이터들을 연결시키는 역할을 하는 것이라고 이해했고 여기서는 feature.properties.name이 data의 구('시군구명')과 연결되어 있다고 이해했습니다. key_on 파라미터는 지도의 색상을 구분할때의 기준을 정하는 역할을 하는데 geo_data와 data간의 공통된 요소여야 한다고 이해했는데 궁극적으로 이 key_on이 choropleth의 작동에서 어떤 역할을 맡는지 잘 이해가 가지 않습니다. key_on이 geo_data에서 색을 나누는 기준인건가요 columns는 data에서 사용하는 콜럼들을 넣는 파라미터라고 이해했습니다. 여기서는 '구'에 따라 '매장수'대로 색을 칠해서 두 column들을 작성한거로 이해해도 되나요?? (그럼 column파라미터에서도 '구'에 따라서 나누어서 칠한다고 명시를 한 것 같은데 굳이 key_on에서도 색을 나누는 기준을 넣는 이유가 뭔지 모르겠습니다. 겹치는 정보 아닌가요??! 질문 너무 많아서 죄송합니다 ㅠㅠ 이해가 더디네요
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
변수 생성
df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskin"), "브랜드명"] = "배스킨라빈스" df_31[["상호명", "브랜드명"]].head() 이 코드에서 df_31["브랜드명"] = 와 같은 식으로 새로운 변수를 먼저 생성해주는 방법 대신 .loc 함수를 통해서 df_31.loc[df_31["상호명_소문자"].str.contains("배스킨라빈스|베스킨라빈스|baskin"), "브랜드명"] = "배스킨라빈스" 이렇게 위치를 지정하는 것도 변수를 생성하는 방법 중 하나일까요? 이 코드가 조금 헷갈려서, 설명 조금만 더 해주시면 감사하겠습니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
이상치 max 함수 외에 범위로 찾기
13/20강의 12분 쯤 나오는 > 40000이 넘는 평당분양가격 찾기 코드를 실행해보았는데, 결과가 아무것도 안나오거나 >40000에 해당이 안되는데도 전체 리스트가 나옵니다. 어떻게 해결할 수 있을까요?
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
folium marker 설정시
선생님 folium marker를 생성할때 popup과 tooltip의 차이점은 이해가 갑니다! 그런데 popup에 <i>를 써주는 이유가 뭔가요 구글링을 해보니 이게 웹개발?할 때에 쓰이는 문구 같은데 여기서는 빼고 작성을 해도 작동은 되는 것 같은데 <i>의 기능이 궁금합니다!
- 미해결공공데이터로 파이썬 데이터 분석 시작하기
str contaions와 extract 차이
-선생님 extract와 contains의 차이는 이해를 했는데요 extract의 경우 총 데이터 개수는 464개이고, contains의 경우는 466개인데 2개의 차이가 어디서 발생하는지 궁금합니다. 조건만 보면 둘 다 같은 데이터 개수가 반환이 되어야할 것 같은데 왜 다른가요??