inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

BigQuery(SQL) 활용편(퍼널 분석, 리텐션 분석)

[바짝스터디 1주차 과제] ARRAY, STRUCT 연습 문제 / PIVOT 연습 문제 / 퍼널 쿼리 연습 문제

107

김덕배

작성한 질문수 3

0

  1. ARRAY, STRUCT

-- array_exercises 테이블
-- 영화(title)별로 장르(genres) UNNEST

SELECT
  movie_id,
  title,
  genre
FROM `advanced.array_exercises`,
CROSS JOIN UNNEST(genres) AS genre

-- array_exercises 테이블
-- 영화(title) 별로 배우(actor), 배역(character) UNNEST

SELECT
  title,
  actors.actor,
  actors.character
FROM `advanced.array_exercises`
CROSS JOIN UNNEST(actors) AS actors

-- array_exercises 테이블
-- 영화(title) 별로 배우(actor), 배역(character), 장르(genre) UNNEST

SELECT
  title,
  actor.actor,
  actor.character,
  genre
FROM `advanced.array_exercises`
CROSS JOIN UNNEST(actors) AS actor
CROSS JOIN UNNEST(genres) AS genre

-- 앱 로그 데이터(app_logs) UNNEST
SELECT
  event_date,
  event_timestamp,
  event_name,
  event_param.key AS key,
  event_param.value.string_value AS string_value,
  event_param.value.int_value AS int_value,
  user_id,
  user_pseudo_id,
  platform
FROM `advanced.app_logs`
CROSS JOIN UNNEST(event_params) AS event_param

 

  1. PIVOT

-- 1.orders 테이블에서 유저(user_id) 별로 주문 금액(amount)의 합계를  PIVOT해주세요. 날짜(order_date)를 행(Row)으로, user_id를 열(Column)으로 만들어야 합니다.
SELECT
  order_date,
  SUM(IF(user_id = 1, amount, 0)) AS user_1,
  SUM(IF(user_id = 2, amount, 0)) AS user_2,
  SUM(IF(user_id = 3, amount, 0)) AS user_3
FROM advanced.orders
GROUP BY ALL
ORDER BY
  order_date

-- 2. orders 테이블에서 날짜(order_date) 별로 유저들의 주문 금액(amount)의 합계를 PIVOT 해주세요. user_id를 행(Row)으로, order_Date를 열(Column)으로 만들어야 합니다.
SELECT
  user_id,
  SUM(IF(order_date = "2023-05-01", amount, 0)) AS `2023-05-01`,
  SUM(IF(order_date = "2023-05-02", amount, 0)) AS `2023-05-02`,
  SUM(IF(order_date = "2023-05-03", amount, 0)) AS `2023-05-03`,
  SUM(IF(order_date = "2023-05-04", amount, 0)) AS `2023-05-04`,
  SUM(IF(order_date = "2023-05-05", amount, 0)) AS `2023-05-05`,
FROM advanced.orders
GROUP BY ALL
ORDER BY
  user_id

-- 3. orders 테이블에서 사용자(user_id)별, 날짜(order_date)별로 주문이 있다면 1, 없다면 0으로 PIVOT 해주세요. user_id를 행(Row)으로, order_date를 열(Column)로 만들고 주문을 많이 해도 1로 처리합니다.
SELECT
  user_id,
  MAX(IF(order_date = "2023-05-01", 1, 0)) AS `2023-05-01`,
  MAX(IF(order_date = "2023-05-02", 1, 0)) AS `2023-05-02`,
  MAX(IF(order_date = "2023-05-03", 1, 0)) AS `2023-05-03`,
  MAX(IF(order_date = "2023-05-04", 1, 0)) AS `2023-05-04`,
  MAX(IF(order_date = "2023-05-05", 1, 0)) AS `2023-05-05`,
FROM advanced.orders
GROUP BY ALL
ORDER BY
  user_id

-- 4.앱 로그 PIVOT
WITH base AS (
SELECT
  event_date,
  event_timestamp,
  event_name,
  user_id,
  user_pseudo_id,
  MAX(IF(param.key = "firebase_screen", param.value.string_value, NULL)) AS firebase_screen,
  MAX(IF(param.key = "food_id", param.value.int_value, NULL)) AS food_id,
  MAX(IF(param.key = "session_id", param.value.string_value, NULL)) AS session_id,
FROM advanced.app_logs
CROSS JOIN UNNEST(event_params) AS param
GROUP BY ALL
)

SELECT
  event_date,
  COUNT(user_id) AS user_cnt
FROM base
WHERE
  event_name = "click_cart"
GROUP BY ALL

 

  1. FUNNEL

with base as (
  select
    event_date,
    event_timestamp,
    event_name,
    user_id,
    user_pseudo_id,
    platform,
    -- event_param
    max(if(event_param.key = 'firebase_screen', event_param.value.string_value, null)) as firebase_screen,
    -- max(if(event_param.key = 'food_id', event_param.value.int_value, null)) as food_id,
    max(if(event_param.key = 'session_id', event_param.value.string_value, null)) as session_id
  from
    advanced.app_logs
  cross join
    unnest(event_params) as event_param
  where
    event_date between '2022-08-01' and '2022-08-18'
  group by all
), filter_event_and_concat_event_and_screen as (

  select
    * except(event_name, firebase_screen, event_timestamp),
    concat(event_name, '-', firebase_screen) as event_name_with_screen,
    datetime(timestamp_micros(event_timestamp), 'Asia/Seoul') as event_datetime
  from
    base
  where
    event_name in ('screen_view', 'click_payment' )
)

select
  event_date,
  event_name_with_screen,
  case
    when event_name_with_screen = 'screen_view-welcome' then 1
    when event_name_with_screen = 'screen_view-home' then 2 
    when event_name_with_screen = 'screen_view-food_category' then 3
    when event_name_with_screen = 'screen_view-restaurant' then 4
    when event_name_with_screen = 'screen_view-cart' then 5
    when event_name_with_screen = 'click_payment-cart' then 6
  else null
  end as step_number,
  count(distinct user_pseudo_id) as cnt
from
  filter_event_and_concat_event_and_screen
group by all
having step_number is not null
order by 1, 3


SELECT
  event_date,
  MAX(IF(event_name_with_screen ="screen_view-welcome", cnt, NULL)) AS `screen_view-welcome`,
  MAX(IF(event_name_with_screen ="screen_view-home", cnt, NULL)) AS `screen_view-home`,
  MAX(IF(event_name_with_screen ="screen_view-food_category", cnt, NULL)) AS `screen_view-food_category`,
  MAX(IF(event_name_with_screen ="screen_view-restaurant", cnt, NULL)) AS `screen_view-restaurant`,
  MAX(IF(event_name_with_screen ="screen_view-cart", cnt, NULL)) AS `screen_view-cart`,
  MAX(IF(event_name_with_screen ="click_payment-cart", cnt, NULL)) AS `click_payment-cart`
FROM main
GROUP BY ALL
ORDER BY
  all

sql Google-Analytics firebase google-sheets bigquery

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 김덕배님.

BigQuery에서 ARRAY, STRUCT, PIVOT 및 퍼널 쿼리를 활용하여 데이터를 분석하는 과정은 매우 흥미롭고 중요한 부분입니다. 이 과정을 통해 데이터의 구조를 이해하고 시각적으로 분석할 수 있는 스킬을 배양하실 수 있습니다.

ARRAY 및 STRUCT를 활용하여 데이터의 세부 구성 요소를 UNNEST하는 방법, 그리고 PIVOT 연산을 통해 데이터를 행과 열로 재구성하는 방법에 대해 질문 주셨군요. SQL 내에서 이러한 기능들을 활용하는 것이 데이터 분석에 얼마나 강력한 도구가 되는지를 체험하실 것입니다.

유사한 질문과 답변들이 아래 링크에 포함되어 있으니 참고하시기 바랍니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

최종 과제 제출

0

82

3

BigQuery 활용편 18강 질문있습니다!

0

84

1

리텐션 공부하다가 궁금한게 생겨 질문드립니다

0

83

2

안녕하세요 강사님 코호트 쿼리 공부하다가 의문점이 생겨서 문의드립니다

0

75

2

biquery 테이블 생성 오류 이슈

0

55

2

동일하게 쿼리를 작성했는데 화면과 다른 값이 나옵니다

0

73

2

[과제] 퍼널 PIVOT 테이블 작성하기

0

67

2

array 등

0

63

2

N day 리텐션 쿼리 관련 질문

0

63

2

이동평균 계산 시 order by 기본값은 뭔가요?

0

69

2

윈도우 연습문제 1번 질문

0

65

1

user_id에 NULL이 나오는데 정상인가요?

0

72

2

3-13 리텐션 과제 제출

0

94

2

최종 과제 제출

0

130

3

weekly retention 구하기 과제

0

90

2

1-9. 피벗 쿼리 작성

0

81

2

app_logs 테이블 생성 문제

0

73

2

Weekly Retention 구하기 완성하였습니다.

0

77

2

[과제] 퍼널 쿼리(피벗테이블 적용) 작성 완료

0

106

2

3-7 Weekly, Monthly Retention 쿼리 작성

0

92

2

정성 데이터 분석 방법 문의

0

165

1

최종 과제 제출

0

108

3

1-6 예시 문제 풀이

0

69

2

최종과제 제출

0

145

2