analytic-sql과 상관 서브쿼리
안녕하세요 강의 열심히 듣고 있습니다. 감사드립니다.
[서브쿼리 실습-02] 수업에 대해 질문이 있습니다.
-- 상관 서브쿼리
select * from hr.emp_dept_hist_01 a where todate = (select max(todate) from hr.emp_dept_hist_01 x where x.empno=a.empno);
-- Analytic SQL
select * from ( select *, row_number() over (partition by empno order by todate desc) as rnum
from hr.emp_dept_hist_01 )a where rnum = 1;
위 두 가지 방법의 성능 차이에 대해 궁금합니다. (고객 데이터 분석 업무를 수행하고 있는데, 데이터가 커서 성능이 항상 이슈더라구요)
강의에서 말씀해주신대로, online 처리를 해야한다면 analytic-sql은 sorting을 해야하기 때문에 상관 서브쿼리가 더 성능이 좋을 것 같습니다.
강의에서 분석을 할 때는(배치로 처리할 때) analytic sql이 더 성능이 좋다고 하셨는데 그 이유는 무엇인가요??
답변 1
0
안녕하십니까,
배치 처리의 경우 보통은 서브쿼리보다 analytic SQL이 성능이 더 좋습니다만, 반드시 그런 경우는 아닐 수 있습니다.
먼저 위의 서브쿼리는 emp_dept_hist_01 테이블을 두번 액세스하고(메인 쿼리에서, 그리고 서브쿼리에서) 연결 시켜야 합니다. 반면에 analytic SQL은 emp_dept_hist_01 테이블을 한번만 읽어도 됩니다.
물론 analytic SQL은 partition by와 order by에 따른 정렬(Sorting)의 부하가 발생합니다. 반면에 위의 서브쿼리는 emp_dept_hist_01 테이블을 셀프 Hash Join으로 연결해 줘야 합니다.
어떤게 더 빠를지는 실제 돌려봐야 하지만, 데이터가 대용량이라면 analytic SQL이 더 빠를 겁니다. 다만 처리해야할 데이터가 너~무 크다면(예를 들어 10억건 이상) analytic SQL의 정렬의 부하가 테이블 Hash 조인의 부하보다 더 커질 수 있습니다.
온라인이라고 analytic SQL이 무조건 느리지 않습니다. 정렬해야할 데이터가 적다면 Analytic SQL이 서브쿼리 보다 더 빠를 수 있습니다. 다만 큰 차이는 없을 것 같습니다.
요약 드리자면 서브쿼리는 테이블간의 연결작업을 수행해야 합니다. 또한 SQL 실행 계획이 잘못 풀리면 대용량 데이터 연결인데도 Hash 조인이 아니라 Nested Loop 조인으로 풀리거나, buffer 등을 과도하게 사용하여 성능을 해칠 수 있습니다. 때문에 대용량 데이터의 분석 작업은 Analytic SQL이 더 선호됩니다.
감사합니다.
'레벨 유지'의 의미에 대한 질문
0
56
2
date_part
0
56
2
lag/lead offset 관련 질문
0
58
2
join 관련 질문 (inner join, left join)
1
101
2
배치에서 full outer join을 쓴다고 하셨는데 예시를 알 수 있을까요?
0
91
2
Madrid에 살고 있는 고객이 주문한 주문 정보를 구할것. 실습 질문드립니다
0
54
2
rollup시 null값 매출 라벨링
0
56
2
10. 조인 실습 - 02 관련 질문
0
61
1
조인실습03 - join의 pk-fk join
0
109
2
조인실습03 - join의 pk-fk join
0
70
2
(공유)맥, 스키마 import
0
82
2
sql 입문자인데, 이 강의와 sql 코딩테스트와 연관이 있을까요?
0
138
2
1인지 M인지는 결국엔 테이블을 직접 확인을 해야 하는걸까요?
0
132
2
안녕하세요. 튜닝핵심가이드강의 관련해서 여쭤보고 싶어서 남깁니다.
0
93
1
섹션5 Group by 실습-01 강의 예제 질문
0
121
2
섹션2 조인 기반 메커니즘에서 조인 실습 - 04 강의 예제 질문
0
125
2
섹션2 조인 실습 01 강의 질문
0
134
2
lead lag 이해 강의에서 윈도우 절은 사용되지 않습니다.
0
128
1
Dbeaver오류
0
632
2
직원 별 가장 높은 매출
0
119
1
강의순서대로 실습코드순알려주세요.
0
134
1
m:n inner join일 경우 cross조인과 동일하게 동작되는건가요?
0
132
1
rollup
0
91
2
Dbeaver에 접속해도 postgressql이 네비게이터에 안보입니다.
0
357
2





