GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다
1
投稿した質問数 9
안녕하세요~
제목 그대로 GROUP BY 시 FULL TABLE SCAN으로 접근하는 이유가 궁금합니다!
인덱스의 경우는 가공하면 정렬된 B-TREE를 제대로 활용할 수 없기 때문에 FULL TABLE SCAN이 된다고 이해했는데, GROUP BY 의 경우에는 왜 인덱스가 적용되지 않는지 질문 드립니다
GROUP BY 절에 따로 인덱스를 가공하지 않았는데 말이에요 🤔
감사합니다
回答 1
0
안녕하세요, 인프런 AI 인턴입니다. dnjswo410님.
GROUP BY 절에서 인덱스가 효율적으로 활용되지 않는 경우가 많이 있습니다. 이는 인덱스 자체가 데이터의 순차적 접근을 위해 최적화되어 있는 반면, GROUP BY는 주로 집계 및 데이터의 재배열을 필요로 하기 때문입니다.
GROUP BY와 인덱스의 관계:
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
- GROUP BY 절이 포함된 쿼리는 인덱스가 순차적으로 탐색하는 중간에도 데이터 그룹화 및 집계를 추가로 해야 하므로, 인덱스가 B-Tree 순서만을 활용해 최적화할 수 있는 범위를 벗어날 수 있다는 것이 한계입니다.
- 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다.
데이터베이스의 최적화 방식:
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
- GROUP BY 절에서는 동일한 데이터 값을 모아서 집계를 해야하기 때문에 경우에 따라서는 인덱스 보다는 테이블을 완전히 스캔하고 group operation을 수행하는 것이 더 빠르게 실행될 수 있다는 판단을 내릴 수 있습니다.
- 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다.
관련된 강의 내용이나 Q&A 게시물에서 추가적인 토론이 있었는지 확인해 보시면 많은 도움이 될 것입니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
FOREIGN KEY 정리하기, 영상대로 SQL코드 복붙해도 안되요.
0
8
1
모델 서빙과 관련된 강좌 출시 예정된 바가 있으신지 여쭤봅니다!
0
9
1
Vercel 실행이 안됩니다
0
6
1
강사님 안녕하세요 ㅎdatabricks환경에 대한 설
0
8
2
노션 링크도 안 열리고, 알려준 vercel도 실행이 안됩니다.
0
19
1
astro dev start - python 라이브러리 설치 fail
0
25
1
코드를 첨부해야하는 이유가 있나요?
0
22
2
맥북 환경구성 에러
0
19
2
간단한 오타 제보입니다.
0
20
1
큰 범위 조회 시 EXPLAIN의 rows 값이 정확하지 않은 이유가 궁금합니다.
0
36
2
실제 FK제약조건을 설정하지 않는이유
0
38
2
Free Edition 실습 영상은 아직 업데이트전인가요?
0
22
1
라이브 운영중인 환경의 테이블에 인덱스 추가시 고려사항
0
36
2
상품 정보 크롤링
0
29
2
강의에 적용한 스크립트를 받아 볼수 있을까요?
0
40
2
실습소실행안되요
0
41
1
수강기간 연장
0
27
1
BCNF 질문
0
49
2
연관 엔티티 네이밍 규칙
0
40
1
맥북용 자료 부탁드립니다.
0
39
2
그 EXISTS의 힌트절에 NESTED LOOP를 쓰는이유 질문
0
77
2
어우 옵티마이저가 뛰어난건지..
0
51
1
안녕하세요 NESTED LOOP 문제에서
0
64
2
Buffers와 TotalCost / cpu_cost / io_cost 의 차이점?
0
93
2

