• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

delete duplicate emails 문제 질문

22.03.03 02:30 작성 조회수 134

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
안녕하세요!
이 문제를 풀기 위해 접근한 방식은 강사님과는 반대로
중복된 email 중 id가 큰 경우 찾은 후 그 id가 큰 경우를 추출한 뒤 DELETE해주는 방식으로 접근했습니다.
 
DELETE
FROM person
WHERE id IN(
SELECT sub.id
FROM (
 SELECT id, COUNT(email)
FROM person
GROUP BY id, email
HAVING COUNT(email) > 1
ORDER BY id DESC
LIMIT 1) sub)

이렇게 작성했는데 답이 안나오더라고요ㅠㅠ

이론상으로는 같은거 같은데 왜 답이 안나올까요?

 

답변 1

답변을 작성해보세요.

0

안녕하세요 gmlwls627님, 답변드립니다.

 

우선 문제에서 각 Id마다 이메일이 있습니다. 따라서 첨부해주신 것처럼 Id 별로 이메일의 개수를 세면 이메일 수는 모든 Id에서 한 개로 집계됩니다. 즉, COUNT(email) > 1인 경우가 없기 때문에 아무것도 삭제되지 않고 input 데이터 그대로 출력됩니다.

강의의 풀이와 반대로 작성하고 싶다면 NOT IN 대신 IN을, MIN 대신 MAX를 사용할 수 있을 텐데요, 이 경우에는 이메일이 중복되지 않은 bob@example.com까지 삭제가 됩니다.

따라서 강의에서는 중복된 이메일, 중복되지 않은 이메일 두 가지 경우를 다 포함할 수 있도록, 특정 이메일에서 Id가 작은 경우를 남기는 방식으로 진행했습니다.

 

답변이 도움이 되었길 바랍니다 :)