인프런 커뮤니티 질문&답변

Busantist님의 프로필 이미지
Busantist

작성한 질문수

[백문이불여일타] 데이터 분석을 위한 고급 SQL

고급반 서브쿼리 해커랭크 challenges 문제 질문

작성

·

199

1

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
 
 
해설에서는 count(*)를 사용했는데 count(challenge_id)를 사용하면 왜 값이 다른지 이해가 잘 되지 않습니다.
부연 설명으로 max(challenge_id)를 하면 50이 나오게 되어 같은 원리로
 
select hacker_id, count(challenge_id) as cnt from challenges group by hacker_id ) as suq_t2 group by cnt having count(challenge_id) = 1
 
을 하게 되면 hacker_id 당 카운트가 1번인 걸 뜻하는 걸로 나올 거라 예상했는데 횟수가 1번인 것만 나오게 되네요.
 
select hacker_id, count(challenge_id) as cnt from challenges group by hacker_id ) as suq_t2 group by cnt having count(cnt) = 1

 

 
아래는 쿼리 전문을 첨부합니다.
 
 
 
/* Enter your query here. */ select h.hacker_id ,h.name ,count(challenge_id) as cnt from Hackers as h inner join Challenges as c on h.hacker_id = c.hacker_id group by h.hacker_id,h.name having cnt in ( select max(cnt) from ( select hacker_id, count(challenge_id) as cnt from challenges group by hacker_id) as suq_t1) or cnt in ( select cnt from ( select hacker_id, count(challenge_id) as cnt from challenges group by hacker_id ) as suq_t2 group by cnt having count(challenge_id) = 1 ) order by 3 desc , 1 asc

답변 1

1

송혜정님의 프로필 이미지
송혜정
지식공유자

안녕하세요 simon9977님, 답변 드립니다.

 

모든 구문에서 COUNT(*) 대신 COUNT(challenge_id)를 사용하신 것의 문제는 아니고,

hacker_id 당 카운트가 1번인 걸 뜻하는 걸로 나올 거라 예상했는데 횟수가 1번인 것만 나오게 되네요.

이 부분 코드에서 오류가 있는 것으로 보입니다.

HAVING절의 OR 구문에서는 cnt 컬럼에 동일한 값이 없는 값만, 즉 출전한 횟수가 같은 학생이 두 명 이상인 데이터는 제외하는 쿼리를 작성해야 합니다. 따라서 출전 횟수가 1인 데이터를 찾는 것이 아니라 출전 횟수의 수가 1인 것을 찾야야 합니다. 즉, challenge_id를 집계한 cnt 컬럼을 집계하는 COUNT(*) 또는 COUNT(cnt)를 해주셔야 합니다.
(ex. cnt 컬럼의 데이터가 7,6,6,5,4 와 같이 있다면, 7,5,4는 각각 1번, 6은 2번 이므로 HAVING COUNT(cnt) = 1 구문이 실행되면 cnt 컬럼의 값이 6인 데이터는 출력되지 않음)
작성하신 쿼리에서 OR의 서브쿼리에서 HAVING COUNT(challenge_id) = 1HAVING COUNT(cnt) = 1 로 변경하여 실행해보세요.

 

답변이 도움되셨길 바랍니다 :)

Busantist님의 프로필 이미지
Busantist
질문자

친절한 설명 감사합니다, S님!

Busantist님의 프로필 이미지
Busantist

작성한 질문수

질문하기