강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

헬로월드님의 프로필 이미지
헬로월드

작성한 질문수

[백문이불여일타] 데이터 분석을 위한 고급 SQL

서브쿼리

WHERE절 서브쿼리에서 DISTINCT 유무에 따른 차이가 있나요?

작성

·

1.2K

0

안녕하세요.

9:20 ~ [WHERE 절 서브쿼리]
두 번째 쿼리를 다음과 같이 정정하니 강의 수강 시 참고 부탁드립니다.

SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes ORDER BY date desc LIMIT 5);

위 내용을 보고 문득 궁금해진 내용인데요. 만약 order by절과 limit절이 없다면, 즉,

SELECT *

FROM crimes

WHERE date IN (SELECT date FROM crimes)

이렇게 적은 것과

SELECT *

FROM crimes

WHERE date IN (SELECT distinct date FROM crimes)

이렇게 적은 것 간의 결과물에 차이가 있나요?

답변 1

1

송혜정님의 프로필 이미지
송혜정
지식공유자

안녕하세요 헬로월드님, 답변드립니다.

우선 질문 주신 내용에서는 결과물간의 차이가 없습니다.

서브쿼리에서 order by 와 limit을 사용했을 때는 중복된 date가 출력되지 않도록 distinct 를 사용해야 최근 5일치 날짜 데이터를 정확히 가져올 수 있습니다.
(이와 관련된 이전 질문이 있어 링크를 첨부 합니다 - 6:50 WHERE 절 서브쿼리에서 아래쪽 쿼리 질문 )

하지만 이런 limit 조건이 없이, 적어주신 것처럼 서브쿼리의 모든 date를 모두 가져올 때는 distinct 사용 유무에 따른 결과 값 차이가 없습니다. 다만 데이터가 클수록 중복 값이 많이 출력될 수 있고, 이 경우 스캔 데이터가 많아지므로 distinct를 사용하는 것이 쿼리 성능에 도움이 될 수는 있습니다.

감사합니다.

헬로월드님의 프로필 이미지
헬로월드
질문자

감사합니다.

헬로월드님의 프로필 이미지
헬로월드

작성한 질문수

질문하기