GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다
34
投稿した質問数 9
안녕하세요~
제목 그대로 GROUP BY 시 FULL TABLE SCAN으로 접근하는 이유가 궁금합니다!
인덱스의 경우는 가공하면 정렬된 B-TREE를 제대로 활용할 수 없기 때문에 FULL TABLE SCAN이 된다고 이해했는데, GROUP BY 의 경우에는 왜 인덱스가 적용되지 않는지 질문 드립니다
GROUP BY 절에 따로 인덱스를 가공하지 않았는데 말이에요 🤔
감사합니다
回答 1
0
안녕하세요, 인프런 AI 인턴입니다. dnjswo410님.
GROUP BY 절에서 인덱스가 효율적으로 활용되지 않는 경우가 많이 있습니다. 이는 인덱스 자체가 데이터의 순차적 접근을 위해 최적화되어 있는 반면, GROUP BY는 주로 집계 및 데이터의 재배열을 필요로 하기 때문입니다.
GROUP BY와 인덱스의 관계:
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
- GROUP BY 절이 포함된 쿼리는 인덱스가 순차적으로 탐색하는 중간에도 데이터 그룹화 및 집계를 추가로 해야 하므로, 인덱스가 B-Tree 순서만을 활용해 최적화할 수 있는 범위를 벗어날 수 있다는 것이 한계입니다.
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
데이터베이스의 최적화 방식:
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
- GROUP BY 절에서는 동일한 데이터 값을 모아서 집계를 해야하기 때문에 경우에 따라서는 인덱스 보다는 테이블을 완전히 스캔하고 group operation을 수행하는 것이 더 빠르게 실행될 수 있다는 판단을 내릴 수 있습니다.
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
관련된 강의 내용이나 Q&A 게시물에서 추가적인 토론이 있었는지 확인해 보시면 많은 도움이 될 것입니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
21c 버전으로 해도 무방한가요?
0
10
3
vercel실행 - failed to fetch
0
14
1
dags_email_on_failure
0
13
1
드랍 테이블로 지운 ordes에 대해서 질문
0
23
1
문제 풀이 1번 질문
0
29
1
아주 작은 정오표 전달드립니다.
0
52
2
mysql워크벤치를 실행할때마다 오류가 뜹니다. 해결 방법좀 가르켜주세요.
0
44
1
DAG 실습 - dags_bash_operator 실행 실패
0
31
3
함수기반 인덱스
0
30
2
날짜 인덱스관련 질문
0
27
1
복합인덱스 확인법
0
24
0
order_product 까마귀발
0
44
2
공통 코드 , 계층 구조 질문
1
40
1
77번 문제
0
27
1
76번 문제
1
35
2
64번 문제 관련
0
37
2
airflow 3로 되면서 2.x대에 지원 중단된 패키지가 많네요..ㅠ
0
43
1
dags 디렉토리안에 sql디렉토리 넣고 .sql 파일로 관리해도 되나요?
0
44
2
2,3차 정규화 질문
0
44
2
맥북용 자료 부탁드립니다.
0
58
2
그 EXISTS의 힌트절에 NESTED LOOP를 쓰는이유 질문
0
105
2
어우 옵티마이저가 뛰어난건지..
0
62
1
안녕하세요 NESTED LOOP 문제에서
0
87
2
Buffers와 TotalCost / cpu_cost / io_cost 의 차이점?
0
108
2

