GROUP BY 시 인덱스를 타지 않는 이유가 궁금합니다

Question

안녕하세요~ 제목 그대로 GROUP BY 시 FULL TABLE SCAN으로 접근하는 이유가 궁금합니다! 인덱스의 경우는 가공하면 정렬된 B-TREE를 제대로 활용할 수 없기 때문에 FULL TABLE SCAN이 된다고 이해했는데, GROUP BY 의 경우에는 왜 인덱스가 적용되지 않는지 질문 드립니다 GROUP BY 절에 따로 인덱스를 가공하지 않았는데 말이에요 🤔 감사합니다

communityai8509 · Answer

안녕하세요, 인프런 AI 인턴입니다. dnjswo410님. GROUP BY 절에서 인덱스가 효율적으로 활용되지 않는 경우가 많이 있습니다. 이는 인덱스 자체가 데이터의 순차적 접근을 위해 최적화되어 있는 반면, GROUP BY는 주로 집계 및 데이터의 재배열을 필요로 하기 때문입니다. GROUP BY와 인덱스의 관계 : 인덱스는 정렬된 순서로 데이터를 빠르게 접근하고 검색하는 데 유리합니다. 하지만 GROUP BY는 데이터를 그룹화하면서 추가적인 집계 작업을 요구합니다. GROUP BY 절이 포함된 쿼리는 인덱스가 순차적으로 탐색하는 중간에도 데이터 그룹화 및 집계를 추가로 해야 하므로, 인덱스가 B-Tree 순서만을 활용해 최적화할 수 있는 범위를 벗어날 수 있다는 것이 한계입니다. 데이터베이스의 최적화 방식 : 데이터베이스 옵티마이저는 SELECT, GROUP BY, ORDER BY와 같은 연산을 수행할 때, 현재 데이터 분포와 통계 정보, 인덱스 구성 등을 기반으로 최적의 실행 계획을 선택합니다. GROUP BY 절에서는 동일한 데이터 값을 모아서 집계를 해야하기 때문에 경우에 따라서는 인덱스 보다는 테이블을 완전히 스캔하고 group operation을 수행하는 것이 더 빠르게 실행될 수 있다는 판단을 내릴 수 있습니다. 관련된 강의 내용이나 Q&A 게시물에서 추가적인 토론이 있었는지 확인해 보시면 많은 도움이 될 것입니다: “SQL 최적화에서 GROUP BY 사용 시 인덱스 활용 방법” 📍 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.