• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

left join을 통해 문제를 풀었는데 질문이 있어요.

22.07.13 14:31 작성 조회수 150

0

안녕하세요 선생님.

저는 선생님께서 풀이하셨던 방법을 생각하지 못해서

1) group by email을 하여 min(id)구하기 --> P2

2) from Person P
           left join P2
           on P.id = P2.min(id)

3) left join을 할 시, P2에는 Null인 경우가 발생하므로

--> where P2.id Is NULL인 경우 필터링 해주기

 

위에 단계로 문제를 풀어서 답을 accepted 받았어요!

 

그런데 데이터 분석을 공부를 하다보니 꼭 left join이 필요한 경우가 아니라면 쓰지 않는 것이 데이터 분석 툴 성능을 위해 좋다는 블로그 글을 보았어요.

그러면 데이터 분석을 할 때 최대한 inner join을 하는 방향으로 쿼리를 짜주는 것이 좋을까요?

질문이 너무 길어졌네요. 답변 해주시면 감사드릴게요..!

(아래는 제가 짠 쿼리 입니다)

delete P1
from Person P1
    left join (select email
                    , min(id) min_id
                from Person
                group by email
               ) P2
    on P1.id = P2.min_id
where P2.min_id IS NULL;
  

답변 1

답변을 작성해보세요.

2

우선 풀이하신 로직과 쿼리에는 문제 없습니다.

INNER JOIN을 되도록 활용하라는 말에는 저도 동의합니다.

LEFT JOIN이 INNER JOIN보다 비싼 연산입니다. 비용과 시간이 많이 든다는 뜻이에요.

데이터가 클 수록 비용 차이가 더 많이 날 수 있고요.

그래서 저렴한 연산 위주로 쿼리를 짜도록 지금부터 습관화하시는 것은 아주 좋다고 생각합니다!