inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실무에서 바로 쓰는 SQL튜닝 45가지

튜닝예제5. having 절에 일반 검색조건을 쓰지 마세요

GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다

34

dnjswo410

작성한 질문수 9

0

안녕하세요~

 

제목 그대로 GROUP BY 시 FULL TABLE SCAN으로 접근하는 이유가 궁금합니다!

 

인덱스의 경우는 가공하면 정렬된 B-TREE를 제대로 활용할 수 없기 때문에 FULL TABLE SCAN이 된다고 이해했는데, GROUP BY 의 경우에는 왜 인덱스가 적용되지 않는지 질문 드립니다

 

GROUP BY 절에 따로 인덱스를 가공하지 않았는데 말이에요 🤔

 

감사합니다

sql oracle 데이터-엔지니어링

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. dnjswo410님.

GROUP BY 절에서 인덱스가 효율적으로 활용되지 않는 경우가 많이 있습니다. 이는 인덱스 자체가 데이터의 순차적 접근을 위해 최적화되어 있는 반면, GROUP BY는 주로 집계 및 데이터의 재배열을 필요로 하기 때문입니다.

  1. GROUP BY와 인덱스의 관계:

    • 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
    • GROUP BY 절이 포함된 쿼리는 인덱스가 순차적으로 탐색하는 중간에도 데이터 그룹화 및 집계를 추가로 해야 하므로, 인덱스가 B-Tree 순서만을 활용해 최적화할 수 있는 범위를 벗어날 수 있다는 것이 한계입니다.
  2. 데이터베이스의 최적화 방식:

    • 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
    • GROUP BY 절에서는 동일한 데이터 값을 모아서 집계를 해야하기 때문에 경우에 따라서는 인덱스 보다는 테이블을 완전히 스캔하고 group operation을 수행하는 것이 더 빠르게 실행될 수 있다는 판단을 내릴 수 있습니다.

관련된 강의 내용이나 Q&A 게시물에서 추가적인 토론이 있었는지 확인해 보시면 많은 도움이 될 것입니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

21c 버전으로 해도 무방한가요?

0

12

3

vercel실행 - failed to fetch

0

19

2

dags_email_on_failure

0

13

1

드랍 테이블로 지운 ordes에 대해서 질문

0

23

1

문제 풀이 1번 질문

0

29

1

아주 작은 정오표 전달드립니다.

0

52

2

mysql워크벤치를 실행할때마다 오류가 뜹니다. 해결 방법좀 가르켜주세요.

0

44

1

DAG 실습 - dags_bash_operator 실행 실패

0

31

3

함수기반 인덱스

0

30

2

날짜 인덱스관련 질문

0

27

1

복합인덱스 확인법

0

24

0

order_product 까마귀발

0

44

2

공통 코드 , 계층 구조 질문

1

40

1

77번 문제

0

27

1

76번 문제

1

35

2

64번 문제 관련

0

37

2

airflow 3로 되면서 2.x대에 지원 중단된 패키지가 많네요..ㅠ

0

43

1

dags 디렉토리안에 sql디렉토리 넣고 .sql 파일로 관리해도 되나요?

0

44

2

2,3차 정규화 질문

0

44

2

맥북용 자료 부탁드립니다.

0

58

2

그 EXISTS의 힌트절에 NESTED LOOP를 쓰는이유 질문

0

106

2

어우 옵티마이저가 뛰어난건지..

0

62

1

안녕하세요 NESTED LOOP 문제에서

0

87

2

Buffers와 TotalCost / cpu_cost / io_cost 의 차이점?

0

108

2