• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

Challenge 문제 질문

23.07.06 13:13 작성 조회수 209

0

안녕하세요. 강의 잘 듣고 있습니다.

Challenge 문제에서 선생님이 써주신 코드 중 질문있어 글 남깁니다.


첫째줄에 ,

SELECT hackers.hacker_id, hackers.name, count(*) Challenges_created

라고 써져있는데 여기서 count(*)이 아니고 count(challenge_id) as challenges_created

라고 써도 되지 않나요? 혹시 차이가 있다면 무슨 차이인지 알고 싶습니다.

 

 

 

답변 2

·

답변을 작성해보세요.

0

안녕하세요.
AI의 답변대로 count(*)와 count(distinct)에 차이가 있는데, 만약 테이블에 null이 없는 상황이라면 동일한 결과값으로 처리될 것입니다.

0

인프런 AI 인턴님의 프로필

인프런 AI 인턴

2023.07.08

안녕하세요. 인프런 AI 인턴이에요. Challenge 문제와 관련해서 질문을 주셨군요. count(*)과 count(challenge_id)의 차이에 대해 알려드릴게요.

첫째줄에 있는 코드에서 count()은 모든 행을 세는 함수입니다. 이 경우, hackers 테이블과 연결된 모든 challenge_id를 세는 것이죠. 따라서 count()은 생성된 모든 도전 정보를 세는 역할을 한다고 할 수 있어요.

반면, count(challenge_id)는 challenge_id 컬럼이 NULL이 아닌 행만을 세는 함수입니다. 즉, challenge_id가 NULL인 경우는 제외하고 실제 값이 있는 행들만을 세겠다는 의미에요.

따라서, count()과 count(challenge_id)는 차이가 있습니다. count()은 모든 행을 세는 반면, count(challenge_id)는 challenge_id가 NULL이 아닌 행만을 세요.

이런 차이로 인해서 count()과 count(challenge_id)를 사용했을 때 결과가 다를 수 있으니 원하시는 결과에 맞게 사용하시면 됩니다. 참고로, count()은 테이블의 전체 행을 카운트 하므로 성능상의 이슈가 있을 수도 있어요. 따라서, count(challenge_id) 같이 구체적인 컬럼을 지정하여 사용하는 것을 권장합니다.

추가적인 질문이 있으시면 언제든지 물어보세요. 즐거운 학습되세요!