-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
WHERE절 서브쿼리에서 DISTINCT 유무에 따른 차이가 있나요?
21.08.28 15:28 작성 조회수 788
0
안녕하세요.
9:20 ~ [WHERE 절 서브쿼리]
두 번째 쿼리를 다음과 같이 정정하니 강의 수강 시 참고 부탁드립니다.
SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes ORDER BY date desc LIMIT 5);
위 내용을 보고 문득 궁금해진 내용인데요. 만약 order by절과 limit절이 없다면, 즉,
SELECT *
FROM crimes
WHERE date IN (SELECT date FROM crimes)
이렇게 적은 것과
SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes)
이렇게 적은 것 간의 결과물에 차이가 있나요?
답변을 작성해보세요.
1
송혜정
지식공유자2021.08.29
안녕하세요 헬로월드님, 답변드립니다.
우선 질문 주신 내용에서는 결과물간의 차이가 없습니다.
서브쿼리에서 order by 와 limit을 사용했을 때는 중복된 date가 출력되지 않도록 distinct 를 사용해야 최근 5일치 날짜 데이터를 정확히 가져올 수 있습니다.
(이와 관련된 이전 질문이 있어 링크를 첨부 합니다 - 6:50 WHERE 절 서브쿼리에서 아래쪽 쿼리 질문 )
하지만 이런 limit 조건이 없이, 적어주신 것처럼 서브쿼리의 모든 date를 모두 가져올 때는 distinct 사용 유무에 따른 결과 값 차이가 없습니다. 다만 데이터가 클수록 중복 값이 많이 출력될 수 있고, 이 경우 스캔 데이터가 많아지므로 distinct를 사용하는 것이 쿼리 성능에 도움이 될 수는 있습니다.
감사합니다.
답변 1