-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
left join을 통해 문제를 풀었는데 질문이 있어요.
22.07.13 14:31 작성 조회수 156
0
안녕하세요 선생님.
저는 선생님께서 풀이하셨던 방법을 생각하지 못해서
1) group by email을 하여 min(id)구하기 --> P2
2) from Person P
left join P2
on P.id = P2.min(id)
3) left join을 할 시, P2에는 Null인 경우가 발생하므로
--> where P2.id Is NULL인 경우 필터링 해주기
위에 단계로 문제를 풀어서 답을 accepted 받았어요!
그런데 데이터 분석을 공부를 하다보니 꼭 left join이 필요한 경우가 아니라면 쓰지 않는 것이 데이터 분석 툴 성능을 위해 좋다는 블로그 글을 보았어요.
그러면 데이터 분석을 할 때 최대한 inner join을 하는 방향으로 쿼리를 짜주는 것이 좋을까요?
질문이 너무 길어졌네요. 답변 해주시면 감사드릴게요..!
(아래는 제가 짠 쿼리 입니다)
delete P1
from Person P1
left join (select email
, min(id) min_id
from Person
group by email
) P2
on P1.id = P2.min_id
where P2.min_id IS NULL;
답변을 작성해보세요.
2
지식공유자 J
지식공유자2022.07.18
우선 풀이하신 로직과 쿼리에는 문제 없습니다.
INNER JOIN을 되도록 활용하라는 말에는 저도 동의합니다.
LEFT JOIN이 INNER JOIN보다 비싼 연산입니다. 비용과 시간이 많이 든다는 뜻이에요.
데이터가 클 수록 비용 차이가 더 많이 날 수 있고요.
그래서 저렴한 연산 위주로 쿼리를 짜도록 지금부터 습관화하시는 것은 아주 좋다고 생각합니다!
답변 1