inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

데이터 분석 SQL Fundamentals

analytic-sql과 상관 서브쿼리

해결된 질문

279

kkt719

작성한 질문수 2

0

안녕하세요 강의 열심히 듣고 있습니다. 감사드립니다.

[서브쿼리 실습-02] 수업에 대해 질문이 있습니다.

 

-- 상관 서브쿼리

select * from hr.emp_dept_hist_01 a where todate = (select max(todate) from hr.emp_dept_hist_01 x where x.empno=a.empno);

-- Analytic SQL

select * from ( select *, row_number() over (partition by empno order by todate desc) as rnum

from hr.emp_dept_hist_01 )a where rnum = 1;

 

위 두 가지 방법의 성능 차이에 대해 궁금합니다. (고객 데이터 분석 업무를 수행하고 있는데, 데이터가 커서 성능이 항상 이슈더라구요)

강의에서 말씀해주신대로, online 처리를 해야한다면 analytic-sql은 sorting을 해야하기 때문에 상관 서브쿼리가 더 성능이 좋을 것 같습니다.

강의에서 분석을 할 때는(배치로 처리할 때) analytic sql이 더 성능이 좋다고 하셨는데 그 이유는 무엇인가요??

sql postgresql dbms/rdbms

답변 1

0

권 철민

안녕하십니까,

배치 처리의 경우 보통은 서브쿼리보다 analytic SQL이 성능이 더 좋습니다만, 반드시 그런 경우는 아닐 수 있습니다.

먼저 위의 서브쿼리는 emp_dept_hist_01 테이블을 두번 액세스하고(메인 쿼리에서, 그리고 서브쿼리에서) 연결 시켜야 합니다. 반면에 analytic SQL은 emp_dept_hist_01 테이블을 한번만 읽어도 됩니다.

물론 analytic SQL은 partition by와 order by에 따른 정렬(Sorting)의 부하가 발생합니다. 반면에 위의 서브쿼리는 emp_dept_hist_01 테이블을 셀프 Hash Join으로 연결해 줘야 합니다.

어떤게 더 빠를지는 실제 돌려봐야 하지만, 데이터가 대용량이라면 analytic SQL이 더 빠를 겁니다. 다만 처리해야할 데이터가 너~무 크다면(예를 들어 10억건 이상) analytic SQL의 정렬의 부하가 테이블 Hash 조인의 부하보다 더 커질 수 있습니다.

온라인이라고 analytic SQL이 무조건 느리지 않습니다. 정렬해야할 데이터가 적다면 Analytic SQL이 서브쿼리 보다 더 빠를 수 있습니다. 다만 큰 차이는 없을 것 같습니다.

요약 드리자면 서브쿼리는 테이블간의 연결작업을 수행해야 합니다. 또한 SQL 실행 계획이 잘못 풀리면 대용량 데이터 연결인데도 Hash 조인이 아니라 Nested Loop 조인으로 풀리거나, buffer 등을 과도하게 사용하여 성능을 해칠 수 있습니다. 때문에 대용량 데이터의 분석 작업은 Analytic SQL이 더 선호됩니다.

감사합니다.

 

'레벨 유지'의 의미에 대한 질문

0

56

2

date_part

0

56

2

lag/lead offset 관련 질문

0

58

2

join 관련 질문 (inner join, left join)

1

101

2

배치에서 full outer join을 쓴다고 하셨는데 예시를 알 수 있을까요?

0

91

2

Madrid에 살고 있는 고객이 주문한 주문 정보를 구할것. 실습 질문드립니다

0

54

2

rollup시 null값 매출 라벨링

0

56

2

10. 조인 실습 - 02 관련 질문

0

61

1

조인실습03 - join의 pk-fk join

0

109

2

조인실습03 - join의 pk-fk join

0

70

2

(공유)맥, 스키마 import

0

82

2

sql 입문자인데, 이 강의와 sql 코딩테스트와 연관이 있을까요?

0

138

2

1인지 M인지는 결국엔 테이블을 직접 확인을 해야 하는걸까요?

0

132

2

안녕하세요. 튜닝핵심가이드강의 관련해서 여쭤보고 싶어서 남깁니다.

0

93

1

섹션5 Group by 실습-01 강의 예제 질문

0

121

2

섹션2 조인 기반 메커니즘에서 조인 실습 - 04 강의 예제 질문

0

125

2

섹션2 조인 실습 01 강의 질문

0

134

2

lead lag 이해 강의에서 윈도우 절은 사용되지 않습니다.

0

128

1

Dbeaver오류

0

632

2

직원 별 가장 높은 매출

0

119

1

강의순서대로 실습코드순알려주세요.

0

134

1

m:n inner join일 경우 cross조인과 동일하게 동작되는건가요?

0

132

1

rollup

0

91

2

Dbeaver에 접속해도 postgressql이 네비게이터에 안보입니다.

0

357

2