inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

다양한 사례로 익히는 SQL 데이터 분석

채널별 고유/주문 사용자 건수와 매출 금액 및 비율 SQL로 구하기 - 02

join 관련 질문

244

최원빈

작성한 질문수 45

0

안녕하세요 선생님:)

다름이 아니라 join 관련 질문이 있어요.

저번 강의에서도 말씀하신 것처럼 join을 session_id로 하셔야 된다고 하셨는데, 만약에 user_id로 하면 결과 값이 드라마틱하게 달라질까요?

전에 MAU를 신규 사용자와 기존 사용자로 구분할 때는 join을 하실 때 user_id로 하셨는데, 이때는 사용자를 수를 구하는 것에 집중하여 user_id로 한 것일까요?

데이터 엔지니어링 퍼포먼스 마케팅 sql postgresql DBMS/RDBMS

답변 1

1

권 철민

안녕하십니까,

어느 테이블과 어느 테이블을 user_id로 조인한다는 건지요?

ga_sess와 orders 테이블을 user_id로 조인한다는 의미로 간주하고 답변드리면,

  1. 저번 강의에서도 말씀하신 것처럼 join을 session_id로 하셔야 된다고 하셨는데, 만약에 user_id로 하면 결과 값이 드라마틱하게 달라질까요?

    => 네, 드라마틱하게 달라집니다.

ga_sess 테이블은 user_id로 m, orders 테이블로 user_id로 m이기 때문에 ga_sess와 orders 테이블을 user_id로 조인하면 m:m 조인이 되어서 원하는 결과 집합이 되지 않습니다.

  1. 전에 MAU를 신규 사용자와 기존 사용자로 구분할 때는 join을 하실 때 user_id로 하셨는데, 이때는 사용자를 수를 구하는 것에 집중하여 user_id로 한 것일까요?

    => 정확히 어떤 쿼리를 의미하는지 잘 모르겠지만, 그냥 실습 코드중에 ga_sess와 ga_users를 조인하는데 user_id로 왜 조인했는지를 묻는 걸로 간주하고 답변 드리면,

    사용자 수를 구하는 거와 별개로, ga_sess를 기준으로 group by를 해야 하는데, 필터링 해야 하는 조건이 ga_users에 잇습니다. 가령, 사용자가 생성된 특정 일시 같은 경우에는 ga_users에 있기 때문에 해당 조건을 ga_users에서 찾고 ga_sess로 연결하는데 이때 연결키가 user_id로 되어 있습니다. 그리고 조인을 했을 때 ga_sess와 ga_users는 user_id 레벨로 1:m 이기 때문에 조인 결과 레벨로 ga_sess로 만들어지기 때문에 원래 ga_sess 집합 레벨로 동일하게 됩니다. 때문에 user_id로 조인했을 뿐입니다.

    감사합니다.

감사합니다.

"주문별 고객별 연관 상품 추출 SQL로 구하기-02" 수업 질문

0

59

2

쿼리 질문있습니다!!

0

56

2

없는강의요청해도됩니까,,

0

95

2

아래와 동일한 질문에 대한 추가질문입니다

0

78

2

cnt/max로 구한 결과의 차이

0

117

2

쿼리에 대한 질문이 있습니다.

0

123

2

퍼널 질문드립니다.

0

116

1

ADSP자격증

0

289

2

특정 스키마에서 생성한 편집기의 쿼리를 판다스에 삽입하는 방법

0

161

1

백업파일 테이블 생성 오류

0

240

1

"사용자별 특정 상품 주문시 함께 가장 많이 주문된 다른 상품 추출하기"에서 조건관련..

0

171

1

Plotly을 이용해 treemap시각화시 공유사항

0

290

2

월단위 카테고리별 매출액과 주문건수 및 전체매출액 대비 비율 sql로 구하기 수업 중 질문이 있습니다.

0

254

1

with 절 질문

0

245

1

데이터 분석 SQL Fundamentals 강의 할인 문의

0

216

1

리텐션 구하는 방법 문의

0

216

1

캐글데이터 Postgresql 사용

0

364

2

mau 구할때 group by 사용안해도 count 집계함수가 왜 가능한지 모르겠습니다.

0

266

1

매출분석 1에서 partition by와 group by의 차이

0

364

1

postgres 설치 오류

0

321

1

맥 계정에서 postgres 접속 시 비밀번호 입력 실패현상

1

555

2

pandas 연계시 오류.....

0

1274

3

시각화 그래프가 안보여요

0

306

1

ntile 정규분포에 관하여 ... 향후 일을 하게 될 시

0

366

1