• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

Tab 자동완성

20.06.01 11:11 작성 조회수 327

1

%mv -Dow 한 다음 Tab을 누르면 그냥 아무 동작이 없습니다. 

혹시 해결방법 있을까요??

Win10입니다.

답변 13

·

답변을 작성해보세요.

1

안녕하세요.

value_counts() 는 단변수에 대한 빈도수를 세는데 사용합니다. 

따라서 변수가 2개 이상일 때는 사용할 수가 없습니다. 그래서 판다스의 시리즈 형태의 데이터로만 연산이 가능합니다.

반면에 groupby 나 pivot_table은 여러 개의 변수에 대해 그룹화가 가능합니다.

그래서  groupby 나 pivot_table은 데이터프레임 형태의 데이터를 가지고 연산할 수 있습니다.

1

dnflwlq601님의 프로필

dnflwlq601

질문자

2020.06.21

value_counts와 count의 차이를 잘 모르겠습니다. ㅠㅠ

g = df_academy_selected.groupby(["상권업종소분류명","시군구명"])["상호명"].value_counts()

g.loc["고시원"]


시군구명 상호명 강남구 코아리빙텔 5 코코리빙텔 4 보보레지던스 3 고시원 2 노블레지던스 2 .. 중랑구 하나원룸텔 1 하이텔고시원 1 한길고시원 1 한서고시원 1 현우고시텔 1 Name: 상호명, Length: 1021, dtype: int64

---------------------------------------------------------------------------------------
g = df_academy_selected.groupby(["상권업종소분류명","시군구명"])["상호명"].count() g.loc["고시원"]
시군구명
강남구     139
강동구      62
강북구      11
강서구      32
관악구      83
광진구      81
구로구      33
금천구      24
노원구      14
도봉구       8
동대문구     69
동작구      79
마포구      29
서대문구     45
서초구      64
성동구      22
성북구      42
송파구      45
양천구      23
영등포구     30
용산구      16
은평구      12
종로구      41
중구       39
중랑구      19
Name: 상호명, dtype: int64

1

dnflwlq601님의 프로필

dnflwlq601

질문자

2020.06.21

감사합니다 ㅠㅠㅠ

1

안녕하세요. 아마도 판다스 버전이 1 이상을 사용하고 계실거 같습니다.

원래 영상에서 사용했던 판다스 버전은 1 이하인데요. 판다스가 버전업을 하면서 몇 가지 옵션이 변경되었네요.

아래와 같이  truncate=False, fit_reg=True 옵션을 추가해 보세요!

1

dnflwlq601님의 프로필

dnflwlq601

질문자

2020.06.21

sns.lmplot(data = df.sample(1000), x = "위도", y = "경도", hue = "시도명")

lmplot을 그렸는데 회귀선이 안나오고 scatter plot으로만 나오네요 

어떻게 해결하죠??

sns.lmplot(data = df.sample(1000), x = "위도", y = "경도", hue = "시도명", fit_reg = True)

이렇게 해도 안됩니다. 

1

dnflwlq601님의 프로필

dnflwlq601

질문자

2020.06.02

감사합니다 그래서 그냥 폴더 경로 찾아서 옮겨서 작업하고 있습니다. 강의 외적으로 궁금한게 있어도 여쭤봐도 되나요 강의를 듣다가 하고 싶은게 생겨서 그렇습니다 ㅠㅠㅠ

0

그리고 각 강의의 오른쪽 상단의 질문하기로 질문을 주시면 어떤 강좌의 내용인지 제가 좀 더 빨리 보고 답변을 드릴 수 있어요!

또, 같은 내용을 궁금해 하시는 분들에게도 도움이 될 수 있으니 아래의 기능으로 질문 주세요!

0

isin 을 잘 설명한 이미지가 있어서 가져왔습니다. 

출처는 다음 경로 입니다. [Pandas Series: isin() function - w3resource](https://www.w3resource.com/pandas/series/series-isin.php) 

전체 데이터 중에 원하는 값만 가져오고자 할때 bolean Indexing 을 하게 됩니다.

df["animal"] == "dog"  이라면 하나의 값에 대한 서브셋만 가져올 수 있습니다.

하지만 여러개의 값을 가져오고자 할 때 isin 을 사용합니다.

Pandas Series: isin() function - w3resource

0

안녕하세요.

melt 는 영상에서도 언급하지만 tidy data 형태로 만들 때 사용합니다.

컬럼에 있는 값을 행으로 녹인다고 생각하면 될거 같습니다. 

melt 는 아파트 분양가 분석에서 최근 데이터와 과거 데이터가 전혀 다른 모습입니다.

최근 데이터는 tidy 데이터 형태로 되어 있지만 과거 데이터는 그렇지 않기 때문에  tidy 형식으로 변경해 준 것 입니다.

아래의 그림이 melt 전과 후를 잘 비교하고 있습니다.

../_images/reshaping_melt.png

0

dnflwlq601님의 프로필

dnflwlq601

질문자

2020.06.22

항상 좋은 답변 주셔서 너무나 감사합니다. 

계속 공부를하다보니 melt  함수와 isin함수가 이해가 잘 안됩니다. 

특히 isin함수는 데이터프레임의 값을 비교하는 것으로 알고있는데 두번째 프로젝트에서는 학원-입시와 어린이집을 겹쳐서 scatterplot으로 구현하실 때 isin을 왜 쓰실려고 했는지 어떤 상황에서 써야하는지를 잘 모르겠습니다. 

항상 너무 감사드립니다. 

0

감사합니다 :)

0

안녕하세요! 답변드릴 수 있는 한도 내의 질문이라면 답변드릴 수 있을거 같아요. 감사합니다 :)

0

안녕하세요.

%가 들어가는 명령은 매직커맨드라고 부릅니다. 터미널에서 실행해 볼 수 있는 명령어를 주피터 노트북 상에서 실행해 볼 수 있는 명령인데요.

이 명령은 OS에 따라 다르게 동작합니다.

"Down~" 이라고 입력했는데 동작하지 않는다면 2가지 문제일 수 있습니다.

1) OS가 mv 명령을 지원하지 않음

2) Down 으로 시작하는 폴더명을 찾을 수 없음

mv  는 move 로 사용할 수도 있지만 윈도우 환경에 따라 해당 명령을 지원하지 않을 수도 있습니다.

그리고 꼭 주피터 노트북에서 파일을 옮겨주는게 아니라 직접 파일을 옮겨주시는 방법으로 사용하셔도 무관합니다.

참고로 유닉스 계열 명령어는 아래의 링크에서 사용할 수 있는데요.

해당 내용은 알고 있어도 좋지만 윈도우 계열의 OS를 계속 사용하실 예정이라면 탐색기를 사용하시는 게 편하실거에요.

유닉스 계열 명령어 :

https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%89%EC%8A%A4_%EB%AA%85%EB%A0%B9%EC%96%B4_%EB%AA%A9%EB%A1%9D

윈도우 계열 명령어 : 

https://zetawiki.com/wiki/%EC%9C%88%EB%8F%84%EC%9A%B0_CMD_%EB%AA%85%EB%A0%B9%EC%96%B4_%EB%AA%A9%EB%A1%9D


그리고 해당 문제는 데이터 분석에서 꼭 필요하다고 보기는 어렵습니다.

조금 더 편하게 경로를 주피터 노트북에서 접근하기 위해 안내해 드린것인데요.

이 문제를 해결하기 위해 오히려 정작 데이터 분석에 써야할 시간을 쓸 수도 있어서요.

윈도우 탐색기를 사용하시는게 더 좋은 방법일 수도 있습니다.