5-6. 4번 문제 WHERE 조건의 위치 문의
안녕하세요.
이전 질문에 대한 답변 감사합니다. type1을 기준으로 해서 4번 문제를 풀었는데요.
저는 trainer 테이블을 기준으로는 achivement_level = "Master"라는 조건이 있고,
trainer_pokemon 테이블에서는 status IN ("Active", "Training")이라는 조건이 있으니
먼저 두 테이블을 이렇게 가공한 후에 JOIN하면 좋지 않을까? 라는 생각으로 아래와 같이 쿼리를 작성했어요.
SELECT
p.type1, COUNT(tp.id) type_cnt
FROM
(SELECT
*
FROM basic.trainer
WHERE
achievement_level = "Master") t
LEFT JOIN
(SELECT
*
FROM `basic.trainer_pokemon`
WHERE
status IN ("Active", "Training")) tp
ON t.id = tp.trainer_id
LEFT JOIN
`basic.pokemon` p
ON tp.pokemon_id = p.id
GROUP BY
p.type1
ORDER BY
type_cnt DESC
LIMIT 1
그런데 풀이에서는 trainer_pokemon 테이블만 status 기준으로 가공한 후, 나머지 테이블을 JOIN하고 -> 마지막에 WHERE 조건으로 achivement_level = "Master" 를 걸어서 데이터를 추리는 것 같더라고요.
현재 데이터 기준으로는 일단 값이 같지만, 뭔가 이 선후관계에 따라서 무언가가 달라질 수도 있을 것 같은데 명확하게 알기가 어려워 질문 드립니다!
확인 부탁 드립니다 :)
Answer 2
0
안녕하세요. 지금 하신 방법이 쿼리 최적화 방식으로는 더 좋은 방법일 수는 있습니다. 미리 가공해서 필요한 것만 JOIN한 것이니 잘 생각하셨어요.
제가 Master를 마지막에 필터링한 이유는 JOIN한 결과를 어떻게 사용할 것인가? 관점에서 Master만 필터링하지 않고 다른 등급의 트레이너를 파악해야 하는 경우 쿼리의 맨 마지막에서 바꿔주는 것이 더 편하기 때문에 이렇게 작성했다고 보시면 됩니다.
단순히 쿼리를 짜는 것이 다가 아니라, 그 쿼리의 결과를 어떻게 사용할지 필터링을 잦게 해야 한다면 어디에 배치할지를 고민하는 것이 필요합니다. 그래서 인프님 쿼리나 제 쿼리의 의도의 차이가 있다고 생각해주시면 될 것 같아요.
0
안녕하세요, 인프런 AI 인턴입니다.
인프님께서 질문하신 것처럼 SQL 쿼리에서 필터링의 순서와 위치는 쿼리의 성능 및 결과에 영향을 미칠 수 있습니다. 특히, 쿼리에서 테이블을 조인하기 전에 미리 데이터를 가공하고 필터링하는 것은 매우 효율적인 방법일 수 있습니다. 이를 통해 조인 연산에서 처리해야 할 데이터의 양을 줄일 수 있기 때문입니다.
쿼리 최적화 방식
미리 필터링한 후 조인하기:
- 두 테이블에서 필요한 조건을 미리 적용하여 데이터를 필터링한 후 조인을 수행하였습니다. 이는 데이터를 최소화하여 서버의 로드와 쿼리 실행 시간을 줄이는 데 유리합니다.
- 두 테이블에서 필요한 조건을 미리 적용하여 데이터를 필터링한 후 조인을 수행하였습니다. 이는 데이터를 최소화하여 서버의 로드와 쿼리 실행 시간을 줄이는 데 유리합니다.
조인 후 필터링하기:
- 반면, 강의에서는
trainer_pokemon의 필터링 조건을 우선 적용한 후trainer와 다른 테이블을 조인한 다음achievement_level = 'Master'조건을 적용하였습니다. 이 방법은 전체적인 데이터를 보고 필요한 조건을 마지막에 필터링하는 방식입니다.
- 반면, 강의에서는
위 두 접근 방식은 데이터의 크기와 구조에 따라 다양한 결과를 초래할 수 있습니다. 대체로, 서버에서 처리해야 할 데이터의 크기를 줄이는 첫 번째 방식이 효율적입니다.
성능 및 결과에 대한 영향
성능: 미리 데이터를 줄이고 조인하면 서버가 처리해야 할 데이터 양이 줄어들어 쿼리 성능이 향상됩니다. 서버는 작은 데이터 집합에서 조인을 수행하고 최종적으로 필터링을 통해 원하는 결과를 추출하므로 처리 시간이 단축될 수 있습니다.
결과의 동일성:
- 현재의 데이터 구성에서는 두 방식 모두 결과가 같을 수 있지만, 데이터 세트가 크거나 구조가 복잡해질 경우 성능 및 결과 정확성에 차이가 날 수 있습니다.
- 특히, 데이터가 누락되거나 중복될 위험을 최소화하려면 미리 필터링하여 필요한 데이터만 다룰 수 있도록 구조화하는 것이 좋습니다.
- 현재의 데이터 구성에서는 두 방식 모두 결과가 같을 수 있지만, 데이터 세트가 크거나 구조가 복잡해질 경우 성능 및 결과 정확성에 차이가 날 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 방식을 설명드리고 있습니다. 관련된 사례로써 다른 질문에 대한 답변을 참조해 보시면, SQL에서 WHERE 및 JOIN 조건의 차이에 대해 더 깊이 이해하실 수 있을 것입니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
vs code
0
48
2
수업자료 다운
0
46
2
쿼리 화면 문의
0
70
2
4-5. 3번 문제 질
0
63
2
JOIN 1번 문제
1
73
2
battle 테이블 생성 시 생성 오류
0
67
1
5-6. 연습문제 4번, type2에 대해서는 고려하지 않아도 될까요?
1
68
2
battle table 오류
0
68
2
location IS NOT NULL 을 굳이 안 써도 되지 않나요?
0
61
2
12강 집계 함수
0
48
1
2-6. 연습 문제 1~3번
0
49
1
안녕하세요! 11번 문제 query문에 관해 질문드립니다
0
49
1
2-6 #2 WHERE vs. HAVING절 사용 여부 차이
0
65
1
섹션 별 퀴즈
0
64
1
espanso 설치 완료 후 프로그램 실행 문제
0
102
2
Syntax에러
0
80
2
4-5. 1번 문제 TIMESTAMP 관련 질문
0
86
2
시각화 도구 사용
0
109
2
11번 문제 GROUP BY 사용하는 이유
0
98
1
big query 쿼리 결과 컬럼 폭
0
107
3
battle 스키마 조건 복사 파일이 열리지 않아요.
0
127
1
6-5 데이터 검증 결과 예시문제
0
78
2
battle 스키마 조건 복사붙여넣기용 자료
0
113
2
17번 문제 질문드립니다.
0
173
3

