inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

df.loc[3, 'a']의 tpye이 numpy인 이유가 궁금합니다.

해결된 질문

198

Zombie's Note

작성한 질문수 1

2

선생님 안녕하세요. 강의 너무 좋습니다.

오늘 공부하다가 궁금한 점이 생겼는데요,

df.loc[3, 'a']의 tpye을 출력해보면, numpy로 나오는 이유가 궁금합니다.

df에서 어떤 column이나 어떤 index의 tpye을 출력하면 series나 DataFrame으로 출력되는데,

하나의 값, 즉 어떤 값을 특정할 때는 왜 type이 numpy로 출력되는지 궁금합니다.

 

pandas python

답변 1

1

박조은

안녕하세요.

좋은 질문을 주셨네요.

판다스 내부는 여러 라이브러리로 되어 있는데요. 대표적인 라이브러리가 numpy와 matplotlib, scipy 등이 있습니다.

numpy는 파이썬의 대표적인 수치계산 라이브러리인데요.

파이썬 과학계산 생태계는 numpy의 역할이 커요.

파이썬은 보통 느리다는 단점이 있는데 numpy는 내부에서 c로 되어 있기 때문에 연산이 빠릅니다.

판다스는 이런 넘파이를 데이터 분석용으로 인터페이스를 만든 라이브러리라고 볼 수 있어요.

넘파이를 좀 더 사용하기 쉽게 추상화를 해 놓은 라이브러리에요.

그래서 데이터프레임.values 와 같은 값을 출력해 봐도 넘파이의 array 형태로 출력되게 됩니다.

마치 시각화 도구 seaborn 이 matplotlib을 사용하기 쉽게 만들어 놓은 것처럼

pandas도 numpy를 사용하기 쉽게 자주 사용하는 기능을 모아놨다고 생각하면 될거에요.

그래서 and, or  연산을 할때도 &, | 와 같은 비트연산을 하게 되는데 

넘파이의 벡터연산을 하기 때문이에요. 물론 속도도 파이썬의 반복문을 사용하는 것보다 엄청 빠르고요.

텐서플로우나 파이토치 같은 딥러닝 라이브러리도 numpy의 다차원 행렬을 다루기 쉽게 만들어 놓은 도구입니다.

그래서 해당 라이브러리도 내부가 대부분 numpy로 구현되어 있습니다.

날짜변환 에러

0

259

0

업로드자료 오류

1

372

1

20강 관련 문의드립니다.

1

299

1

17강 도입부 실습사이트 문의

2

298

1

4강 코드 오류메세지 관련 질의

1

374

2

merge와 그룹바이 관련 질문이 있습니다.

1

494

3

쉬운 도서 추천 좀 부탁드립니다.

2

393

2

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

1

251

1

주피터노트북 목록(contents) 만들기

1

632

1

df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다

1

207

1

월 주 함꼐 value_counts()

1

223

1

day_count.iloc[i]와 day_count[i]의 차이 질문

1

350

1

df 인덱싱 질문입니다

1

184

1

그래프에 한글제목을 나타내고 싶습니다.

1

535

1

배운 것 기반으로 만들어보고 있는데 질문이 있습니다.

1

404

5

질문이요

1

300

1

set_index()

1

287

1

timeit 관련 질문

1

363

1

그래프 밑에 제목을 넣으려면 어떡해야하나요???

1

421

2

한글폰트 설치 후 나오지 않는 현상 문의

1

1171

3

CSV 파일 불러오기

1

571

1

크롤링으로 csv파일 가져오기

2

317

1

영상에서 소개해주시는 웹사이트

2

258

1

질문

1

228

2