강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

ZZAMBA님의 프로필 이미지
ZZAMBA

작성한 질문수

김영한의 실전 데이터베이스 - 기본편

복합 인덱스3

강의에서 나온 IN 최적화 관련 질문

작성

·

19

0

학습하는 분들께 도움이 되고, 더 좋은 답변을 드릴 수 있도록 질문 전에 다음을 꼭 확인해주세요.


1. 강의 내용과 관련된 질문을 남겨주세요.
2. 인프런의 질문 게시판과 자주 하는 질문(링크)을 먼저 확인해주세요.
(자주 하는 질문 링크: https://bit.ly/3fX6ygx)
3. 질문 잘하기 메뉴얼(링크)을 먼저 읽어주세요.
(질문 잘하기 메뉴얼 링크: https://bit.ly/2UfeqCG)

질문 시에는 위 내용은 삭제하고 다음 내용을 남겨주세요.
=========================================
[질문 템플릿]
1. 강의 내용과 관련된 질문인가요? (예)
2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? (예)
3. 질문 잘하기 메뉴얼을 읽어보셨나요? (예)

[질문 내용]
안녕하세요. 이번 복합 인덱스3 강의에서 인덱스 활용 팁으로 범위 조건을 IN절로 바꿔 최적화하는 부분을 설명해 주셨습니다. IN이 마치 OR처럼 변화될 수 있다고 설명해 주셨고 실제 쿼리 실행 시에 이를 확인할 수 있었습니다.(강의 시간 18분 경)

 

그런데 이후 비유해주신 쿼리에서는 UNION ALL을 사용하셨습니다. 저는 ORUNION ALL이 동일한 기능을 수행한다 생각했지만 실제로 눈으로 확인하고 싶어서 다음 세가지 쿼리를 모두 EXPLAIN, ANALYZE 해보았습니다.

 

1) 기존 IN 쿼리

EXPLAIN ANALYZE 
SELECT *
FROM items
WHERE category IN ('패션', '헬스/뷰티') AND price = 20000;

2) OR로 풀어낸 쿼리

EXPLAIN ANALYZE 
SELECT *
        FROM items
        WHERE (category = '패션' AND price = 20000) OR (category = '헬스/뷰티' AND price = 20000);

3) UNION ALL 로 풀어낸 쿼리

EXPLAIN ANALYZE
SELECT * FROM items WHERE category = '패션' AND price = 20000
UNION ALL
SELECT * FROM items WHERE category = '헬스/뷰티' AND price = 20000;

 

그 결과 2)의 처리 cost는 1.41, 3)의 처리 cost는 0.7로 나타났으며, 1)은 2)와 동일하게 실행되었습니다. 여기서 다음 의문이 나타났습니다.

 

1) IN 최적화는 OR 또는 UNION ALL 방식으로 옵티마이저가 상황에 따라 선택하나요? 혹은 OR 방식으로만 처리하나요?

2) OR, UNION ALL을 모두 사용할 수 있을 때, 언제 각각을 사용하는 것이 더 좋을까요? 그리고 위 경우에서는 왜 UNION ALL이 더 cost가 작았을까요?

3) 만약 새로운 카테고리가 추가된다면 모든 IN 쿼리에 해당 카테고리를 추가할 수도 있을 것 같습니다. 그래서 애플리케이션 계층(JPA 등으로)에서 category >= '패션'SELECT DISTINCT쿼리 1번, 해당 값을 통해 IN에 넣어주는 쿼리 1번, 총 2번 쿼리를 실행하는 방식으로 바꾼다면 기존 쿼리를 수정하지 않아도 괜찮을 것 같은데 실무면에서 어떻게 생각하시는지 궁금합니다!

 

긴 질문이었습니다. 감사합니다!

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. ZZAMBA님!

질문해주신 내용은 쿼리 최적화와 관련된 것으로, SQL에서 IN, OR, UNION ALL의 성능 차이에 관한 궁금증이 많으신 것 같습니다. 우선 관련성 있는 기존 답변을 제공해드리고, 질문에 대한 답변을 드리겠습니다.

관련 질문 URL:

이 글에서도 IN 조건과 관련된 최적화 및 성능 문제를 다루고 있습니다. 워낙 다양한 컨텍스트에서 사용되다 보니 여러 적용 사례를 통해 더 많은 인사이트를 얻을 수 있습니다.

질문에 대한 답변:

  1. IN 최적화는 OR 또는 UNION ALL 방식으로 옵티마이저가 상황에 따라 선택하나요?

옵티마이저는 데이터베이스 엔진에 따라 다르게 작동할 수 있습니다. 일반적으로 IN 절은 내부적으로 OR로 변환되어 처리되지만, 특정 상황에서는 UNION이나 UNION ALL 방식으로 처리되는 경우도 있습니다. 최적화를 위해 상황에 맞는 방식으로 자동 변환되며, 데이터베이스의 버전과 인덱스 구조에 따라 차이가 발생할 수 있습니다.

  1. OR, UNION ALL을 모두 사용할 수 있을 때, 언제 각각을 사용하는 것이 더 좋을까요?

    • OR은 단일 쿼리로 구성되어 있어 코드가 간결하고 이해하기 쉽다는 장점이 있습니다. 그러나 쿼리 수행 시 인덱스를 제대로 활용하지 못하게 되어 성능 저하를 일으킬 수 있습니다.
    • UNION ALL은 두 개 이상의 쿼리 결과를 합치는 방식으로, 각 쿼리마다 인덱스를 활용할 수 있어 결과적으로 성능이 더 나을 수 있습니다. 다만, 리소스를 많이 사용하는 경우 여러 차례의 데이터 스캔이 진행되므로 주의가 필요합니다.
  2. 새로운 카테고리가 추가된다면 SELECT DISTINCT를 사용하는 방식 어떻게 생각하시는지?

SELECT DISTINCT를 통해 값을 추출한 후 IN 조건에 넣는 방식은 어느 정도의 유지보수성을 향상시킬 수 있습니다. 하지만 두 번의 쿼리를 수행하는 구조이므로, 데이터의 크기나 데이터베이스의 성능에 따라 적절히 사용해야 합니다. 실무에서는 애플리케이션 로직에서 비즈니스 로직을 처리하거나 캐싱 전략 등을 활용해 쿼리 횟수를 줄이는 방법을 고려할 수도 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

ZZAMBA님의 프로필 이미지
ZZAMBA

작성한 질문수

질문하기