인프런 커뮤니티 질문&답변
[빠짝스터디 1주차 과제] ARRAY,STRUCT, PIVOT, FUNNEL 연습문제
작성
·
99
0
1. ARRAY, STRUCT 연습문제
array_exercises 테이블에서 각 영화(title)별로 장르(genres)를 UNNEST해서 보여주세요.
SELECT
title, genre
FROM advanced.array_exercises AS ae
CROSS JOIN UNNEST(genres) AS genrearray_exercises 테이블에서 각 영화(title)별로 배우(actor)와 배역(character)을 보여주세요.
배우와 배역은 별도의 컬럼으로 나와야 합니다.
SELECT
title,
actor.actor,
actor.character
FROM advanced.array_exercises AS ae
CROSS JOIN UNNEST(actors) AS actorarray_exercises 테이블에서 각 영화(title)별로 배우(actor)와 배역(character), 장르(genre)를 출력하세요. 한 Row에 배우, 배역, 장르가 모두 표시되어야 합니다.
SELECT
title,
actor.actor,
actor.character,
genre
FROM advanced.array_exercises AS ae
, UNNEST(actors) AS actor
, UNNEST(genres) AS genre앱 로그 데이터(app_logs)의 배열을 풀어주세요.
SELECT
user_id,
event_date,
event_name,
user_pseudo_id,
event_param.key AS key,
event_param.value.string_value AS string_value,
event_param.value.int_value AS int_value
FROM advanced.app_logs
, UNNEST(event_params) AS event_param
-- WHERE
-- event_date = "2022-08-01"2. PIVOT 연습 문제
orders 테이블에서 유저(user_id)별로 주문 금액(amount)의 합계를 PIVOT 해주세요.
날짜(order_date)를 행(row)으로, user_id를 열(column)으로 만들어야 합니다.
SELECT
order_date,
MAX(IF(user_id = 1, sum_of_amount, 0)) AS user_1,
MAX(IF(user_id = 2, sum_of_amount, 0)) AS user_2,
MAX(IF(user_id = 3, sum_of_amount, 0)) AS user_3
FROM (
SELECT
order_date,
user_id,
SUM(amount) AS sum_of_amount
FROM advanced.orders
GROUP BY order_date, user_id
ORDER BY order_date
)
GROUP BY order_date
ORDER BY order_dateorders 테이블에서 날짜(order_date)별로 유저들의 주문 금액(amount)의 합계를 PIVOT 해주세요.
user_id를 행(row)으로, order_date를 열(column)으로 만들어야 합니다.
SELECT
user_id,
MAX(IF(order_date = '2023-05-01', amount, 0)) AS `2023-05-01`,
MAX(IF(order_date = '2023-05-02', amount, 0)) AS `2023-05-02`,
MAX(IF(order_date = '2023-05-03', amount, 0)) AS `2023-05-03`,
MAX(IF(order_date = '2023-05-04', amount, 0)) AS `2023-05-04`,
MAX(IF(order_date = '2023-05-05', amount, 0)) AS `2023-05-05`,
FROM advanced.orders
GROUP BY user_id
ORDER BY user_idorders 테이블에서 사용자(user_id)별, 날짜(order_date)별로 주문이 있다면 1, 없다면 0으로 해주세요.
user_id를 행(row)으로, order_date를 열(column)로 만들고 주문을 많이 해도 1로 처리합니다.
SELECT
user_id,
MAX(IF(order_date = '2023-05-01', 1, 0)) AS `2023-05-01`,
MAX(IF(order_date = '2023-05-02', 1, 0)) AS `2023-05-02`,
MAX(IF(order_date = '2023-05-03', 1, 0)) AS `2023-05-03`,
MAX(IF(order_date = '2023-05-04', 1, 0)) AS `2023-05-04`,
MAX(IF(order_date = '2023-05-05', 1, 0)) AS `2023-05-05`,
FROM advanced.orders
GROUP BY user_id
ORDER BY user_iduser_id = 32888이 카트 추가하기(click_cart)를 누를 때 어떤 음식(food_id)을 담았나요?
WITH base AS (
SELECT
event_date,
event_timestamp,
event_name,
user_id,
user_pseudo_id,
MAX(IF(event_param.key = 'firebase screen', event_param.value.string_value, NULL)) AS firebase_screen,
MAX(IF(event_param.key = 'food_id', event_param.value.int_value, null)) AS food_id,
MAX(IF(event_param.key = 'session_id', event_param.value.string_value, null)) AS session_id
FROM advanced.app_logs
, UNNEST(event_params) AS event_param
GROUP BY ALL
)
SELECT
food_id
FROM base
WHERE
user_id = 32888
AND event_name = 'click_cart'
GROUP BY food_id3. 퍼널 분석 연습문제
각 퍼널의 유저 수를 집계
WITH base AS(
SELECT
event_date,
event_timestamp,
event_name,
user_id,
user_pseudo_id,
platform,
MAX(IF(event_param.key = "firebase_screen", event_param.value.string_value, NULL)) AS firebase_screen,
MAX(IF(event_param.key = "food_id", event_param.value.int_value, NULL)) AS food_id,
MAX(IF(event_param.key = "session_id", event_param.value.int_value, NULL)) AS session_id
FROM `advanced.app_logs`
CROSS JOIN UNNEST(event_params) AS event_param
GROUP BY ALL
), filter_event_and_concat_event_and_screen AS(
SELECT
* EXCEPT(event_name, firebase_screen),
CONCAT(event_name, "-", firebase_screen) AS event_name_with_screen,
DATETIME(TIMESTAMP_MICROS(event_timestamp), "Asia/Seoul") AS event_datetime
FROM base
WHERE
event_date BETWEEN "2022-08-01" AND "2022-08-18"
AND
event_name IN ("screen_view", "click_payment")
AND
firebase_screen IN ("welcome", "home", "food_category", "restaurant", "cart")
)
SELECT
event_date,
event_name_with_screen,
CASE
WHEN event_name_with_screen = 'screen_view-welcome' THEN 1
WHEN event_name_with_screen = 'screen_view-home' THEN 2
WHEN event_name_with_screen = 'screen_view-food_category' THEN 3
WHEN event_name_with_screen = 'screen_view-restaurant' THEN 4
WHEN event_name_with_screen = 'screen_view-cart' THEN 5
WHEN event_name_with_screen = 'click_payment-cart' THEN 6
ELSE NULL
END AS step_number,
COUNT(DISTINCT user_pseudo_id) AS cnt
FROM filter_event_and_concat_event_and_screen
GROUP BY ALL
HAVING step_number IS NOT NULL
ORDER BY event_date, step_number답변 1
0
안녕하세요, 인프런 AI 인턴입니다. 이현수님. BigQuery를 활용하여 SQL 연습과 퍼널 분석을 진행하시면서 다양한 기능을 시도하고 계시네요. ARRAY, STRUCT, PIVOT, 그리고 퍼널 분석과 같은 고급 기술을 이해하는 것은 데이터 분석에서 매우 중요한 부분입니다.
아래에 몇 가지 참고할 만한 기존 답변과 관련 사례가 있어 소개해 드립니다. 이는 연습문제 해결에 있어 다소 도움이 될 수 있을 것입니다.
ARRAY 및 STRUCT 사용법
- 구글 스프레드시트 사용 시 데이터 로그 설계에 대한 질문: 이 게시물은 분석 데이터의 구조화를 돕기 위해 어떤 구조적 접근이 필요할지를 다루고 있습니다.
- 구글 스프레드시트 사용 시 데이터 로그 설계에 대한 질문: 이 게시물은 분석 데이터의 구조화를 돕기 위해 어떤 구조적 접근이 필요할지를 다루고 있습니다.
PIVOT 및 퍼널 쿼리 작성 오류
- 퍼널 SQL 쿼리 작성하기 - 오류 해결 사례: 이 질문에서는 PIVOT 및 퍼널 쿼리를 작성할 때 발생하는 일반적인 오류와 이를 어떻게 해결할 수 있는지를 탐구합니다.
- 퍼널 SQL 쿼리 작성하기 - 오류 해결 사례: 이 질문에서는 PIVOT 및 퍼널 쿼리를 작성할 때 발생하는 일반적인 오류와 이를 어떻게 해결할 수 있는지를 탐구합니다.
퍼널 분석 유저 수 집계
- 퍼널별 유저들의 새로운 세션 시작 횟수의 총합 - 윈도우 함수 응용: 이 질문에서는 윈도우 함수를 사용하여 퍼널별로 세션 시작 횟수를 집계하는 방법을 다룹니다. 유용한 예제가 포함되어 있으며, 적용해 볼 수 있습니다.
- 퍼널별 유저들의 새로운 세션 시작 횟수의 총합 - 윈도우 함수 응용: 이 질문에서는 윈도우 함수를 사용하여 퍼널별로 세션 시작 횟수를 집계하는 방법을 다룹니다. 유용한 예제가 포함되어 있으며, 적용해 볼 수 있습니다.
각 사례와 답변은 퍼널 분석 및 데이터 구조에 관한 명확한 설명을 제공하며, 여러분의 코드 작성이나 테스트 전략에 직접적인 인사이트를 줄 수 있습니다. 도움이 되셨기를 바랍니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.





