inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[백문이불여일타] 데이터 분석을 위한 고급 SQL

서브쿼리

WHERE절 서브쿼리에서 DISTINCT 유무에 따른 차이가 있나요?

1206

헬로월드

작성한 질문수 20

0

안녕하세요.

9:20 ~ [WHERE 절 서브쿼리]
두 번째 쿼리를 다음과 같이 정정하니 강의 수강 시 참고 부탁드립니다.

SELECT *
FROM crimes
WHERE date IN (SELECT distinct date FROM crimes ORDER BY date desc LIMIT 5);

위 내용을 보고 문득 궁금해진 내용인데요. 만약 order by절과 limit절이 없다면, 즉,

SELECT *

FROM crimes

WHERE date IN (SELECT date FROM crimes)

이렇게 적은 것과

SELECT *

FROM crimes

WHERE date IN (SELECT distinct date FROM crimes)

이렇게 적은 것 간의 결과물에 차이가 있나요?

sql

답변 1

1

송혜정

안녕하세요 헬로월드님, 답변드립니다.

우선 질문 주신 내용에서는 결과물간의 차이가 없습니다.

서브쿼리에서 order by 와 limit을 사용했을 때는 중복된 date가 출력되지 않도록 distinct 를 사용해야 최근 5일치 날짜 데이터를 정확히 가져올 수 있습니다.
(이와 관련된 이전 질문이 있어 링크를 첨부 합니다 - 6:50 WHERE 절 서브쿼리에서 아래쪽 쿼리 질문 )

하지만 이런 limit 조건이 없이, 적어주신 것처럼 서브쿼리의 모든 date를 모두 가져올 때는 distinct 사용 유무에 따른 결과 값 차이가 없습니다. 다만 데이터가 클수록 중복 값이 많이 출력될 수 있고, 이 경우 스캔 데이터가 많아지므로 distinct를 사용하는 것이 쿼리 성능에 도움이 될 수는 있습니다.

감사합니다.

0

헬로월드

감사합니다.

순위 함수 연습 문제 - 스테디셀러 작가 찾기

0

99

1

문제 내용이 잘못된 것 같습니다.

0

72

2

서브쿼리 질문

0

74

2

[수업질문] 서브쿼리 > null데이터 avg사용 주의

0

85

1

서브쿼리는 언제 작성하는건가요?

0

85

1

안녕하세요 질문드립니다.

0

73

2

Top Earners 문제관련 질문

0

100

2

고급반 cheetsheet

0

164

2

196. Delete Duplicate Emails 좋은 코드 질문

0

145

1

a.id = 1과 b.id=1이 없어도 되는 이유

0

133

0

강의 플랫폼

0

203

3

리트코드 177번 function 풀이중 case when 활용을 위한 서브쿼리 구문을 제출 시 검증에 통과되지 않도록 보강된 듯 하네요

0

213

2

ERD 읽는법에 추가 질문 있어요

0

258

1

lead, lag로 풀이할 시 id 값이 존재하지 않는 경우의 오답

0

368

2

사용자정의함수

0

233

1

이 문제 inner join이 이해가 안됩니다.

0

302

1

평균 함수 사용할 때 주의점과 해결법

0

266

1

196. subquery로 풀 때, 궁금한 점

0

391

2

쿼리성능 질문드립니다.

0

318

1

리트코드 highest department salary 문제

0

264

2

The report 문제 order by부분 질문

0

274

2

리트코드 서브쿼리 문제 질문

0

423

1

DEPARTMENT HIGHEST SALARY 서브쿼리 문제 문의

0

243

1

서브쿼리의 활용사례 및 조인관련질문

0

292

1