GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다
26
9 asked
안녕하세요~
제목 그대로 GROUP BY 시 FULL TABLE SCAN으로 접근하는 이유가 궁금합니다!
인덱스의 경우는 가공하면 정렬된 B-TREE를 제대로 활용할 수 없기 때문에 FULL TABLE SCAN이 된다고 이해했는데, GROUP BY 의 경우에는 왜 인덱스가 적용되지 않는지 질문 드립니다
GROUP BY 절에 따로 인덱스를 가공하지 않았는데 말이에요 🤔
감사합니다
Answer 1
0
안녕하세요, 인프런 AI 인턴입니다. dnjswo410님.
GROUP BY 절에서 인덱스가 효율적으로 활용되지 않는 경우가 많이 있습니다. 이는 인덱스 자체가 데이터의 순차적 접근을 위해 최적화되어 있는 반면, GROUP BY는 주로 집계 및 데이터의 재배열을 필요로 하기 때문입니다.
GROUP BY와 인덱스의 관계:
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
- GROUP BY 절이 포함된 쿼리는 인덱스가 순차적으로 탐색하는 중간에도 데이터 그룹화 및 집계를 추가로 해야 하므로, 인덱스가 B-Tree 순서만을 활용해 최적화할 수 있는 범위를 벗어날 수 있다는 것이 한계입니다.
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
데이터베이스의 최적화 방식:
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
- GROUP BY 절에서는 동일한 데이터 값을 모아서 집계를 해야하기 때문에 경우에 따라서는 인덱스 보다는 테이블을 완전히 스캔하고 group operation을 수행하는 것이 더 빠르게 실행될 수 있다는 판단을 내릴 수 있습니다.
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
관련된 강의 내용이나 Q&A 게시물에서 추가적인 토론이 있었는지 확인해 보시면 많은 도움이 될 것입니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
77번 문제
0
9
1
76번 문제
1
14
2
64번 문제 관련
0
19
2
airflow 3로 되면서 2.x대에 지원 중단된 패키지가 많네요..ㅠ
0
23
1
dags 디렉토리안에 sql디렉토리 넣고 .sql 파일로 관리해도 되나요?
0
22
2
2,3차 정규화 질문
0
27
2
수강완료 후 문의 드립니다.
1
32
2
실전 모의고사 난이도
0
28
2
Part2 기출 문제 및 해설 자료 파일 없음 형태
0
39
2
21번 마지막 설명에 대해 질문이 있습니다.
0
32
2
노랭이67번
0
27
1
[DB설계] 탈퇴 유저의 구독 정보 유지 및 이메일 마스킹 관련 질문입니다.
0
29
1
자연키 vs 대리키 실무질문
0
19
1
38번 문제 보기 3,4번
1
33
3
14번 문제
1
37
2
결재했는데도 강좌가 안보입니다.
0
35
1
모바일 앱 쿠폰
0
38
1
SQL 기본 문법
0
39
2
1:N 관계에서 중간테이블 (연관엔티티)
0
44
2
맥북용 자료 부탁드립니다.
0
47
2
그 EXISTS의 힌트절에 NESTED LOOP를 쓰는이유 질문
0
89
2
어우 옵티마이저가 뛰어난건지..
0
58
1
안녕하세요 NESTED LOOP 문제에서
0
73
2
Buffers와 TotalCost / cpu_cost / io_cost 의 차이점?
0
101
2

