DISTINCT 질문 드립니다.

Question

DISTINCT 관련 질문 드립니다.만약 COUNT(city) - COUNT(DISTINCT city) 문제에서처럼 중복값을 빼준다고 했을 때,DISTINCT는 city 이름이 같은 경우에만 중복값으로 인지하는지, 아니면 그 row에 다른 data (예를들면 위도, 적도) 등도 같을 경우에 중복값으로 인지하는지 궁금합니다.전자의 경우에는 위치는 다르지만 우연히 두 도시의 이름이 같을 경우 중복으로 인지할 것이고,후자일 경우에는 작성자의 실수로 같은 데이터가 두번 입력됬을때 중복으로 인지할텐데, DISTINCT가 구분하는 경우가 어떻게 되나요?

Answer

예시로 추가 설명 드립니다.city | latitudeseoul | 37seoul | 36위와 같은 데이터에서 count(city) - count(distinct city) = 2 - 1 = 1 입니다. count(distinct city) 를 계산할 때 latitude는 고려 대상이 아닙니다.

Answer

안녕하세요, 인프런 AI 인턴입니다.  SQL의 DISTINCT 키워드는 SELECT 문에 사용될 때 중복되는 행을 제거하는데 쓰입니다. 이때 중복 여부는 DISTINCT 다음에 명시된 컬럼들의 조합에 기반하여 결정됩니다.  예를 들어, SELECT DISTINCT city 문을 실행하면, &lsquo;city&rsquo; 컬럼의 값이 같은 행들을 중복으로 간주하고 결과에서는 각각 다른 &lsquo;city&rsquo; 값을 가진 유일한 행들만을 반환합니다. 여기서 다른 컬럼들은 고려 대상이 아닙니다.  만약 &lsquo;city&rsquo;와 &lsquo;latitude&rsquo;, &lsquo;longitude&rsquo; 등 다른 컬럼들을 포함시키고 싶다면 쿼리는 SELECT DISTINCT city, latitude, longitude 와 같이 작성되어야 하며, 이 경우 각 행의 중복 여부는 &lsquo;city&rsquo;, &lsquo;latitude&rsquo;, &lsquo;longitude&rsquo; 컬럼 조합의 유일성에 따라 판단됩니다.  따라서 DISTINCT는 지정된 컬럼들의 조합으로 중복을 구별하기 때문에, 질문하신 첫 번째 경우(도시 이름만 같고 다른 데이터는 다를 때)에 해당하는 경우만 중복으로 간주합니다. 다른 데이터가 동일해야 전체 행이 중복으로 판단되며 이것은 두 번째 경우에 해당합니다.

김별

DISTINCT 질문 드립니다.

이 글과 비슷한 Q&A

컬럼 안 공백 문자열 제외

코드 에디터가 이상한데, 어떤 설정을 건드려야할지 모르겠어요.

4-5. 시간 데이터 연습 문제 2번 문제 관련

battle 테이블 형성할 때 제가 어떤 실수를 했을까요?