dataframe 접근속도 관련 문의
답변 1
1
안녕하세요.
유튜브 영상을 다시 촬영해서 올린거라 loc의 사용방법에 대해 .loc[행, 열] 로 사용하는 게 빠르다는 의도였는데
유튜브에서는 비교 대상이 달라서 혼란이 있었겠네요. 꼼꼼하게 봐주셔서 고맙습니다.
timeit 으로 속도를 측정한건 loc 사용법에 대해 [행][열] 보다는 [행, 열]로 사용하는 것이 좋다는 의도입니다.
df[열][행] 은 두 번 인덱싱 해서만 사용할 수 있고 행을 먼저 인덱싱 하려면 .loc[행][열]을 사용해야 합니다.
그래서 이 두 가지 방법 중에는 보통 인덱싱 순서에 따라 사용하면 되는데 속도가 중요하다면 df[열][행] 을 사용해 주세요.
실제로 현업에서 pandas 를 사용하다보면 3 가지의 속도를 크게 느낄 만큼 병목이 생길 정도는 아닙니다.
그래서 현업에서 사용할 때는 어떤 걸 먼저 인덱싱해야 하는지 목적에 따라 사용할 때가 더 많습니다.
물론 데이터가 몇G이상 넘어가게 되면 차이가 커지기도 하는데 인덱싱 부분은 체감할 만큼의 속도차는 아니기는 합니다. 그래서 결론은 df[열][행] 을 사용하는게 가장 빠르지만 .loc를 사용한다면 .loc[행, 열]을 사용하는게 속도나 대괄호 타이핑이 약간 줄어든다는 면에서 더 좋습니다.
cufflinks 버전문제로 iplot() 미실행
0
42
2
[수정요청]직접 수집한 주가 데이터로 시각화해보기
0
52
2
pd.read_html(url, encoding='cp949') 에러
0
75
2
fdr.StockListing('KRX') 문제 발생
0
137
2
주식 자동매매 프로그램 제작 관련 조언 부탁드립니다
0
431
1
concat 을 통한 데이터 프레임 합치기 에러 문의
0
105
2
한글폰트 관련해서 문의드립니다.
0
230
2
데이터프레임 칼럼명 문의 드립니다.
0
239
3
금융데이터 수집의 모든것
0
145
2
녹화시점과 현재시점 컬럼명이 변경이 많이 되었을까요?
0
192
2
파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기 - 섹션1 [2/2]
0
174
1
Mac 환경에서 nbextensions 활성화 하는 방법
0
594
2
pd.concat(result.tolist()) 오류 문의
0
244
1
5.1 제약 데이터 수집 오류 해결
0
231
1
Table of contents 문의드립니다
0
209
2
concat을 통한 데이터프레임 합치기
0
548
2
Reindexing only valid with uniquely valued Index objects 오류 질문입니다.
0
491
1
데이터 비교시 데이터 불일치
0
410
1
dtype={"itemcode": np.object}) 을 dtype={"itemcode": object}) 으로 변경해야 하나요?
0
593
1
질문 : for문 풀어쓰기
0
488
1
파이참에서 Plotly 그래프 실행방법
0
1308
1
5.1 데이터프레임 병합(merge)
0
741
2
쥬피터노트북에서 실행파일 만들기
0
1449
1
주피터노트북 확장팩 설치가 안됩니다.
0
562
2





