일별 잔존율 SQL 로직에서 궁금증이 있습니다.
385
작성한 질문수 2
안녕하세요.
강사님의 강의를 잘 듣고 있는 와중, 일별 잔존율 SQL문에서 궁금증이 생겼습니다.
SQL 로직을 보면 사용자 테이블과 세션 테이블을 left join 한 다음,
사용자 아이디, 생성일자, 방문일자로 그룹화하고,
다시 생성일자로 그룹화 한 후 생성일 기준 고유 사용자 수와 D+N 별 고유 사용자 수를 구하는 것으로 이해했습니다.
다만 세 컬럼으로 그룹화를 하게 되면,
아이디 생성일자 방문일자
U0179281 2016-10-24 2016-10-25
U0179281 2016-10-24 2016-10-26
와 같은 케이스가 나오게 되는데,
이를 다시 생성일자로 그룹화한 다음 count(*) 로 생성일 기준 모수를 구하게 되면 사용자 아이디는 중복으로 집계되는 것이 아닌지 궁금합니다.
생성일 기준 고유 사용자 수(모수)를 구하려면 10월 24일에 생성한 사용자 U0179281 1개만 집계되어야 하는게 아닌가 싶어 질문드립니다.
답변 3
2
지적하신 대로 중복 건수를 배제해야 하는데 제가 실수 했군요.
count(*) as cnt가 아니라 count(distinct a.user_id) as cnt가 되어야 합니다.
말씀해주셔서 감사드리며, 강의 영상은 빨리 수정해야 하지만, 현재 다른 촉박한 일정으로 인해 8월 말까지 보완하도록 하겠습니다.
감사합니다.
"주문별 고객별 연관 상품 추출 SQL로 구하기-02" 수업 질문
0
52
2
쿼리 질문있습니다!!
0
49
2
없는강의요청해도됩니까,,
0
91
2
아래와 동일한 질문에 대한 추가질문입니다
0
71
2
cnt/max로 구한 결과의 차이
0
102
2
쿼리에 대한 질문이 있습니다.
0
116
2
퍼널 질문드립니다.
0
113
1
ADSP자격증
0
283
2
특정 스키마에서 생성한 편집기의 쿼리를 판다스에 삽입하는 방법
0
161
1
백업파일 테이블 생성 오류
0
236
1
"사용자별 특정 상품 주문시 함께 가장 많이 주문된 다른 상품 추출하기"에서 조건관련..
0
162
1
Plotly을 이용해 treemap시각화시 공유사항
0
279
2
월단위 카테고리별 매출액과 주문건수 및 전체매출액 대비 비율 sql로 구하기 수업 중 질문이 있습니다.
0
250
1
with 절 질문
0
240
1
데이터 분석 SQL Fundamentals 강의 할인 문의
0
215
1
리텐션 구하는 방법 문의
0
215
1
캐글데이터 Postgresql 사용
0
357
2
mau 구할때 group by 사용안해도 count 집계함수가 왜 가능한지 모르겠습니다.
0
262
1
매출분석 1에서 partition by와 group by의 차이
0
356
1
postgres 설치 오류
0
319
1
맥 계정에서 postgres 접속 시 비밀번호 입력 실패현상
1
543
2
pandas 연계시 오류.....
0
1249
3
시각화 그래프가 안보여요
0
300
1
ntile 정규분포에 관하여 ... 향후 일을 하게 될 시
0
361
1





