join 관련 질문
244
작성한 질문수 45
안녕하세요 선생님:)
다름이 아니라 join 관련 질문이 있어요.
저번 강의에서도 말씀하신 것처럼 join을 session_id로 하셔야 된다고 하셨는데, 만약에 user_id로 하면 결과 값이 드라마틱하게 달라질까요?
전에 MAU를 신규 사용자와 기존 사용자로 구분할 때는 join을 하실 때 user_id로 하셨는데, 이때는 사용자를 수를 구하는 것에 집중하여 user_id로 한 것일까요?
답변 1
1
안녕하십니까,
어느 테이블과 어느 테이블을 user_id로 조인한다는 건지요?
ga_sess와 orders 테이블을 user_id로 조인한다는 의미로 간주하고 답변드리면,
저번 강의에서도 말씀하신 것처럼 join을 session_id로 하셔야 된다고 하셨는데, 만약에 user_id로 하면 결과 값이 드라마틱하게 달라질까요?
=> 네, 드라마틱하게 달라집니다.
ga_sess 테이블은 user_id로 m, orders 테이블로 user_id로 m이기 때문에 ga_sess와 orders 테이블을 user_id로 조인하면 m:m 조인이 되어서 원하는 결과 집합이 되지 않습니다.
전에 MAU를 신규 사용자와 기존 사용자로 구분할 때는 join을 하실 때 user_id로 하셨는데, 이때는 사용자를 수를 구하는 것에 집중하여 user_id로 한 것일까요?
=> 정확히 어떤 쿼리를 의미하는지 잘 모르겠지만, 그냥 실습 코드중에 ga_sess와 ga_users를 조인하는데 user_id로 왜 조인했는지를 묻는 걸로 간주하고 답변 드리면,
사용자 수를 구하는 거와 별개로, ga_sess를 기준으로 group by를 해야 하는데, 필터링 해야 하는 조건이 ga_users에 잇습니다. 가령, 사용자가 생성된 특정 일시 같은 경우에는 ga_users에 있기 때문에 해당 조건을 ga_users에서 찾고 ga_sess로 연결하는데 이때 연결키가 user_id로 되어 있습니다. 그리고 조인을 했을 때 ga_sess와 ga_users는 user_id 레벨로 1:m 이기 때문에 조인 결과 레벨로 ga_sess로 만들어지기 때문에 원래 ga_sess 집합 레벨로 동일하게 됩니다. 때문에 user_id로 조인했을 뿐입니다.
감사합니다.
감사합니다.
"주문별 고객별 연관 상품 추출 SQL로 구하기-02" 수업 질문
0
59
2
쿼리 질문있습니다!!
0
56
2
없는강의요청해도됩니까,,
0
95
2
아래와 동일한 질문에 대한 추가질문입니다
0
78
2
cnt/max로 구한 결과의 차이
0
117
2
쿼리에 대한 질문이 있습니다.
0
123
2
퍼널 질문드립니다.
0
116
1
ADSP자격증
0
289
2
특정 스키마에서 생성한 편집기의 쿼리를 판다스에 삽입하는 방법
0
161
1
백업파일 테이블 생성 오류
0
240
1
"사용자별 특정 상품 주문시 함께 가장 많이 주문된 다른 상품 추출하기"에서 조건관련..
0
171
1
Plotly을 이용해 treemap시각화시 공유사항
0
290
2
월단위 카테고리별 매출액과 주문건수 및 전체매출액 대비 비율 sql로 구하기 수업 중 질문이 있습니다.
0
254
1
with 절 질문
0
245
1
데이터 분석 SQL Fundamentals 강의 할인 문의
0
216
1
리텐션 구하는 방법 문의
0
216
1
캐글데이터 Postgresql 사용
0
364
2
mau 구할때 group by 사용안해도 count 집계함수가 왜 가능한지 모르겠습니다.
0
266
1
매출분석 1에서 partition by와 group by의 차이
0
364
1
postgres 설치 오류
0
321
1
맥 계정에서 postgres 접속 시 비밀번호 입력 실패현상
1
555
2
pandas 연계시 오류.....
0
1274
3
시각화 그래프가 안보여요
0
306
1
ntile 정규분포에 관하여 ... 향후 일을 하게 될 시
0
366
1





