• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

WHERE절 서브쿼리에서 DISTINCT 유무에 따른 차이가 있나요?

21.08.28 15:28 작성 조회수 788

0

안녕하세요.

9:20 ~ [WHERE 절 서브쿼리]
두 번째 쿼리를 다음과 같이 정정하니 강의 수강 시 참고 부탁드립니다.

SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes ORDER BY date desc LIMIT 5);

위 내용을 보고 문득 궁금해진 내용인데요. 만약 order by절과 limit절이 없다면, 즉,

SELECT *

FROM crimes

WHERE date IN (SELECT date FROM crimes)

이렇게 적은 것과

SELECT *

FROM crimes

WHERE date IN (SELECT distinct date FROM crimes)

이렇게 적은 것 간의 결과물에 차이가 있나요?

답변 1

답변을 작성해보세요.

1

안녕하세요 헬로월드님, 답변드립니다.

우선 질문 주신 내용에서는 결과물간의 차이가 없습니다.

서브쿼리에서 order by 와 limit을 사용했을 때는 중복된 date가 출력되지 않도록 distinct 를 사용해야 최근 5일치 날짜 데이터를 정확히 가져올 수 있습니다.
(이와 관련된 이전 질문이 있어 링크를 첨부 합니다 - 6:50 WHERE 절 서브쿼리에서 아래쪽 쿼리 질문 )

하지만 이런 limit 조건이 없이, 적어주신 것처럼 서브쿼리의 모든 date를 모두 가져올 때는 distinct 사용 유무에 따른 결과 값 차이가 없습니다. 다만 데이터가 클수록 중복 값이 많이 출력될 수 있고, 이 경우 스캔 데이터가 많아지므로 distinct를 사용하는 것이 쿼리 성능에 도움이 될 수는 있습니다.

감사합니다.

감사합니다.