inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[8/20] pivot_table 로 데이터 연산하고 groupby 와의 차이를 이해하기

선생님

376

freedom07

작성한 질문수 104

1

선생님 안녕하세요 

어제까지 강의 들으면서 주피터노트북에 따라 적었던 것들 다 저장하고 다시 켜서 저장한대로 그대로 남아있었고..
지금 이 강의를 5분 부터 들으려고 하는데

저장된 파일 열어서

df_last.groupby(["전용면적"])["평당분양가격"].mean()

구문 치는데 df_last 파일 없다고 나와서..

다시 위로 올라가서 부터 실행하니까,,,

또 "평당분양가격"도 없다고 하고..ㅠㅠ

저장해도 실행은 다시 또 해줘야 하는 부분인가요..?ㅠㅠㅠ

제가 했던 부분까지만 다시 실행할 때는 어떻게 해야 할 까요..ㅠㅠ?

그리고 혹..날아갈까봐..주피터노트북에 적었던 내용들을 python으로 다운로드 하려고 하는데..

다운로드하려고 하는데 '이 파일이 컴퓨터를 손상시킬 수 있는데 계속 하시겠습니까?' 이런 문구가 뜨는데..ㅠ

주피터노트북 말고 다른 파일로 저장해서 보는 방법으로는 어떻게 하는 걸 추천하시나요..ㅠㅠ?

python pandas numpy

답변 6

1

celestial_

와 저거 pdf는 주피터 쓰면서 몰랐는데 진짜 엄청 좋은기능이네요 교수님께 포폴 가져갈 일 있는데 유용하겠네요 진짜 당연히 pdf변환기만 쓰느라 쥬피터 상에서 pdf 변환하는 법은 구글링을 안해봤었는데........덩달아 감사합니다!  

0

박조은

감사합니다 :)

1

freedom07

답변 항상 감사해요 선생님..ㅠㅠ..!! 
그리고 groupby가 pivot_table보다 속도가 더 빠른 이유가 시리즈 형태로 나와서 그렇다고 하는데 제가 들은 '시리즈'가 맞나요..?

개념을 잘 몰라서 제가 들은 게  잘 들은건지 모르겠네요..ㅠㅠ

1

freedom07

아 그렇군요..ㅠㅠ 원리까지 잘 설명해주시고 답변 정말 감사합니다..ㅠㅠ

그리고 혹..날아갈까봐..주피터노트북에 적었던 내용들을 python으로 다운로드 하려고 하는데..

다운로드하려고 하는데 '이 파일이 컴퓨터를 손상시킬 수 있는데 계속 하시겠습니까?' 이런 문구가 뜨는데..ㅠ

왜그러는 걸까요..ㅠ.ㅠ?

선생님은 주피터노트북 말고 다른 파일로 저장해서 보는 방법으로는 어떻게 하는 걸 추천하시나요..ㅠㅠ?


0

박조은

안녕하세요.

Series 가 맞습니다!

제대로 들으신거 맞아요 :)

0

박조은

안녕하세요.

.ipynb에 output 결과가 남아있다면 그 문구나 그래프는 날아가지 않아요.

파일에 텍스트나 이미지 형태로 남아있게 됩니다.

그런데 주피터 노트북이 아니라 PDF 형태 등으로 보고 싶다면  아래와 같이 파일>다운로드>html 문서로 다운로드 받으신 후에 

웹브라우저로 열어서 인쇄=>PDF로 저장을 권장해요.

바로 PDF로 저장하면 포맷이 깨지고 원하는 형태로 잘 저장이 되지 않습니다.

그래서 html => PDF 변환을 권장합니다.

0

박조은

안녕하세요.

주피터 노트북에서 실행해 준 내용은 물리적 드라이브(HDD, SSD등)에 저장되지 않고

단기기억장치인  메모리(RAM)에 저장되게 됩니다.

RAM에 있는 기억은 단기기억장치이기 때문에 휘발성입니다.

따라서 주피터 노트북을 재시작 했을 때 이전에 실습했던 코드와 output 내용이 보이더라도

그 내용은 .ipynb 파일에 기존의 내용이 남아있는 것이고 RAM에는 해당 내용이 올라가 있지 않아요.

그래서 주피터 노트북을 다시 실행해 주면 메모리 상에 올라가도록 실행을 해주셔야 합니다.

또 주피터 노트북의 장점이자 단점이 셀을 실행한 순서대로 RAM에 올라가게 되는데 이때 변수의 내용 등이 순서대로 할당 될 수 있도록 코드를 순차적으로 작성해 주시고 셀을 순차적으로 실행해 주시는게 좋습니다.

주피터 노트북에 보면 아래와 같은 메뉴가 있는데 새로 시작했을 때 Restart& Run all 을 해주시면 순차적으로 셀을 실행해 주게 됩니다.

특정셀 이전 혹은 이후부터 실행하고자 한다면 다음의 메뉴를 사용해 주시면 됩니다.

계속 화이팅입니다! 감사합니다 :)

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

341

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

213

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

477

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

292

1