WHERE절 서브쿼리에서 DISTINCT 유무에 따른 차이가 있나요?
1206
작성한 질문수 20
안녕하세요.
9:20 ~ [WHERE 절 서브쿼리]
두 번째 쿼리를 다음과 같이 정정하니 강의 수강 시 참고 부탁드립니다.
SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes ORDER BY date desc LIMIT 5);
위 내용을 보고 문득 궁금해진 내용인데요. 만약 order by절과 limit절이 없다면, 즉,
SELECT *
FROM crimes
WHERE date IN (SELECT date FROM crimes)
이렇게 적은 것과
SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes)
이렇게 적은 것 간의 결과물에 차이가 있나요?
답변 1
1
안녕하세요 헬로월드님, 답변드립니다.
우선 질문 주신 내용에서는 결과물간의 차이가 없습니다.
서브쿼리에서 order by 와 limit을 사용했을 때는 중복된 date가 출력되지 않도록 distinct 를 사용해야 최근 5일치 날짜 데이터를 정확히 가져올 수 있습니다.
(이와 관련된 이전 질문이 있어 링크를 첨부 합니다 - 6:50 WHERE 절 서브쿼리에서 아래쪽 쿼리 질문 )
하지만 이런 limit 조건이 없이, 적어주신 것처럼 서브쿼리의 모든 date를 모두 가져올 때는 distinct 사용 유무에 따른 결과 값 차이가 없습니다. 다만 데이터가 클수록 중복 값이 많이 출력될 수 있고, 이 경우 스캔 데이터가 많아지므로 distinct를 사용하는 것이 쿼리 성능에 도움이 될 수는 있습니다.
감사합니다.
순위 함수 연습 문제 - 스테디셀러 작가 찾기
0
99
1
문제 내용이 잘못된 것 같습니다.
0
72
2
서브쿼리 질문
0
74
2
[수업질문] 서브쿼리 > null데이터 avg사용 주의
0
85
1
서브쿼리는 언제 작성하는건가요?
0
85
1
안녕하세요 질문드립니다.
0
73
2
Top Earners 문제관련 질문
0
100
2
고급반 cheetsheet
0
164
2
196. Delete Duplicate Emails 좋은 코드 질문
0
145
1
a.id = 1과 b.id=1이 없어도 되는 이유
0
133
0
강의 플랫폼
0
203
3
리트코드 177번 function 풀이중 case when 활용을 위한 서브쿼리 구문을 제출 시 검증에 통과되지 않도록 보강된 듯 하네요
0
213
2
ERD 읽는법에 추가 질문 있어요
0
258
1
lead, lag로 풀이할 시 id 값이 존재하지 않는 경우의 오답
0
368
2
사용자정의함수
0
233
1
이 문제 inner join이 이해가 안됩니다.
0
302
1
평균 함수 사용할 때 주의점과 해결법
0
266
1
196. subquery로 풀 때, 궁금한 점
0
391
2
쿼리성능 질문드립니다.
0
318
1
리트코드 highest department salary 문제
0
264
2
The report 문제 order by부분 질문
0
274
2
리트코드 서브쿼리 문제 질문
0
423
1
DEPARTMENT HIGHEST SALARY 서브쿼리 문제 문의
0
243
1
서브쿼리의 활용사례 및 조인관련질문
0
292
1





