Cộng đồng Hỏi & Đáp của Inflearn
최종 과제 제출
Viết
·
72
0
안녕하세요, 처음 인사드립니다!
분석 내용을 정리하다 보니 분량이 길어져 부득이하게 아래와 같이 3개의 페이지로 나누어 작성하였습니다.
Food Express DAU·WAU·MAU 및 시간대별 패턴 분석
Food Express 퍼널 분석
Food Express 리텐션 및 코호트 분석
전체적인 흐름은 시계열 관점에서 DAU·WAU를 통해 전반적인 추세를 먼저 파악한 뒤, 퍼널 분석과 리텐션 분석으로 확장하는 방식으로 구성하였습니다.
해석 과정에서는 가능한 한 개인적인 추측이나 과도한 주관을 배제하고, 데이터 기반으로 내용을 정리하고자 노력하였습니다.
아직 많이 부족하지만, 분석 기법의 적절성이나 논리 전개의 타당성 측면에서 보완이 필요한 부분이 있다면 편하게 조언해주시면 감사하겠습니다.
https://www.notion.so/3097a7fdec7f802ca46cf2a615b3fc97?source=copy_link
Câu trả lời 3
0
안녕하세요. 문제 푸시느라 고생하셨습니다!
우선 여러 시도를 해주신 점 칭찬드리고 싶어요! 이 레포트를 제 팀원이 제게 가지고 왔다면 어떻게 피드백을 할지 생각하며 의견을 드려봅니다.
구체적인 문제 정의를 더 해보시면 좋겠어요. 구체적인 문제 정의가 거의 보이지 않아요. 스킬(시계열 분석 등)이 더 보이는데, 현업에서는 문제 정의를 제대로 하는 것이 제일 중요해요. 스킬(How) 영역은 문제 정의가 어떻게 되느냐에 따라 나오는거라 문제 정의를 하는 것이 중요합니다.
현재 인사이트라고 해주신 부분을 봤는데, 인사이트보다는 데이터 현황 파악을 해주신 것 같아요. 인사이트라고 하면 단순 데이터 해석을 넘어서 의미를 찾는 과정이 인사이트입니다. 단순히 지표가 이정도 올랐다 -> 데이터 현황 해석이고, 인사이트는 지금 지표가 갑자기 올랐던 부분이 왜 올랐는가? 에 대한 이유를 찾아야 합니다
아래와 같이 남겨주셨는데
공휴일·주말 기반 스파이크 효과를 재현하고 이를 일반화할 수 있는 전략 설계가 필요하다(공휴일 효과를 감안하더라도, 전일 대비 4~5배 수준의 결제 증가는 일반적인 캘린더 효과를 초과하는 비정상적 스파이크로 해석 가능)
머신러닝에서 일반화, 정규화, 이상치를 제외하는 작업을 많이 하는데 지금 과제의 핵심은 "수요 예측"이 아니라, 이런 상황을 어떻게 진단할 것인가?입니다. 그래서 일반화를 원하는 것이 아닙니다. 실제로 데이터를 보면 전일 대비 4-5배 수준의 결제 증가가 있을 수 있습니다. 이럴 때 이 상황을 비정상적이고 이상치라고 하는 것은 머신러닝의 모델 생성 관점이고, 데이터 분석에서는 이런 케이스가 왜 발생했을까?를 고민해보는 것이 필요합니다. 어떤 이유로 4-5배가 올랐을까, 어떤 검색이 올랐지? 등
원래 이걸 더 스스로 찾아보게 하려는 과제인건데, 힌트를 드리자면 저희가 언제 배달을 시키나요? 국민적으로 어떤 이벤트가 발생하면 많은 사람들이 치킨을 시키나요? 이걸 보고 어떤 것을 떠올릴 수 있는데, 현업에서는 이런 것을 스스로 생각해야 합니다.
지금 올라갔네 => 어 왜 그러지? (Why So?) => 오 올랐던 케이스들이 대부분 이런 케이스다. => 그럼 이제 무엇을 해야 할까?(So What?) 이 흐름을 가져가는 것이 필요합니다.
단순히 쿼리를 실행하고 시각화를 한다고 데이터 분석이 아니고, 이게 왜 발생했지?라는 것을 계속 생각하는 것이 필요합니다. 이런 과정은 논리적 사고 과정인데 데이터 분석과 일을 하는 과정에서 이 역량이 제일 중요합니다. 스킬보다 이런 사고 과정이 핵심 역량이에요. 이 부분에 대한 내용은 제 PM을 위한 데이터 리터러시 강의에서 다루고 있어요. 이 강의를 보시면 어떤 방식으로 생각을 전개해야 하는지 더 이해가 되실 거예요(BigQuery 강의 듣고 리터러시 강의를 들은 분들이 리터러시 강의를 먼저 들었으면 좋았을 것 같다는 후기도 남겨주셨었어요)
데이터를 분석하는 과정은 지금처럼 데이터를 보면서 데이터를 해석해보고 => 그 안에서 가설을 만들어야 합니다. 어 이거 왜 이러지? => 그리고 데이터를 또 확인하고 => 오 이것 때문이네! 라고 나오면 이 부분을 인사이트라 부를 수 있습니다. 그리고 이 인사이트를 어떻게 적용해야 우리 지표가 오를까? 고민하는 것이 중요합니다.
퍼널 분석을 보니, 퍼널 분석도 데이터를 해석만 하고 구체적인 가설이 보이지 않아요. 데이터를 분석할 땐 특정 집단과 다른 집단을 비교해야 합니다. 지금 인사이트에 써주신 카테고리 탐색 경로 퍼널 분석은 현황 데이터를 해석한 것이고, 더 구체적으로 가려면 "신규 회원의 카테고리 탐색 경로" vs "기존 회원의 카테고리 탐색 경로" 이렇게 데이터를 더 쪼개서 봐야 합니다. 비교를 해야 한다를 기억하시면 좋겠어요.
더 나아가서는 검색을 한번이라도 시도한 유저 vs 시도하지 않은 유저의 검색 퍼널 지표가 다른지도 볼 수 있지요. 이렇게 두 집단을 비교하면 "검색을 한번이라도 한 집단이 검색을 하지 않은 집단보다 페이지 전환율이 n%p 더 높다"라고 결론이 나올 수 있는데, 이런 결론은 인사이트라고 부를 수 있을 겁니다. 한단계 더 들어갔기 때문이에요
카테고리쪽 가설에서 "가설: 카테고리 기반 탐색은 가장 직관적인 discovery 경로로 작동하며, UI 개선 및 추천 알고리즘 고도화 시 전환율과 매출 기여도 증가 가능성이 있다."라고 해주셨는데 가설을 제시했다면 구체적으로 이게 맞다고 볼 수 있는 근거(데이터)가 있어야 합니다. 직관적인 것은 다음 퍼널로 많이 갔기 때문에 그렇게 정의를 했을까요? 직관적이다의 정의는 무엇일까요?
데이터를 보고 더 쪼개면 => 개선 방향(Action Item)이 더 구체적으로 될 수 있어요. 이 관점을 꼭 기억하시면 좋겠습니다
리텐션 분석에서 신규나 기존 유저를 나눠주셨는데, 단순히 숫자만 제시하는 것이 아니라 신규 유저가 급격한 감소를 했다면 왜 그럴까?를 한번 더 깊게 고민해보셔요.
<가설1> 추천 기능이 최소 주문 금액 미충족 상태의 사용자를 보정하여(0 → 1 전환), 결제 가능 상태로 유도함으로써 전체 전환율을 충족 사용자 수준으로 끌어올렸을 가능성이 있다.
<가설2> 일부 사용자에게는 쿠폰, 프로모션, 배달 정책 등으로 최소 주문 금액을 충족하지 않아도 결제가 가능한 구조가 존재하여, 0 상태에서도 높은 전환율이 유지되었을 가능성이 있다.
위 두 가설은 근거가 부족해서 팀장 관점에서 "가능성이 있다고 했는데 그래서 진짜에요?"라고 말하면 할 말이 없어질 수 있지요. 이 이유가 진짜 맞을까? => 탐색해보기를 계속 해보셔요.
분석 방법론보다 문제를 구체적으로 쪼개고, 쪼갠 내용을 보면서 가설을 만드는 연습을 해보셔요. 궁금한 내용이나 이해가 되지 않는 부분이 있다면 남겨주셔요. 고생하셨습니다!
현재 데이터를 가지고 할 수 있는 것을 생각하는 것도 역량이에요. 그래서 생각하시는 가설이 이 데이터에 없다면, 이 데이터로 확인할 수 있는 가설을 만들어 보세요. 면접에서도 비슷하게 질문하는 회사들이 꽤 있더라구요
프로젝트를 수정한다면 말씀하신 흐름으로 해보면 될 것 같아요
검색을 한 번이라도 시도한 유저의 검색 퍼널 지표라고 했는데, 과거에 검색을 통해 결제를 경험한 유저와 아닌 유저의 검색 퍼널이 다른지?라고 생각해주세요. 제가 축약해서 작성했었네요. 또는 검색을 한 사람과 아닌 사람의 결제 전환율의 차이도 볼 수도 있겠지요
고객 나누는 기준은 https://blog.ab180.co/posts/retention-series-3-2 Amplitude 글 확인해보셔요. 해주신 내용과 위 글과 유사합니다. 대신 "일정 기간(churn_weeks)"이걸 어떻게 판단할 것인가? 관점에서 데이터의 분포도 그려보셔요. 그래야 기준을 잡을 수 있어요
0
0
안녕하세요, 인프런 AI 인턴입니다. 안상우님!
최종 과제 제출과 관련하여 질문을 주셨네요. BigQuery 활용편 강의에서의 과제 진행 방식에 대해 기존 질문들에서 유용한 정보를 제공하고 있는 링크들을 아래에 추천해 드립니다. 이를 통해 분석 기법의 적절성과 논리 전개의 타당성에 대한 조언을 얻으실 수 있길 바랍니다.
데이터 분석 과제 점검: 이 게시물에서는 데이터 분석을 수행할 때 주의할 점과 평가 기준에 대한 조언을 얻을 수 있습니다. 특히 DAU, WAU, MAU를 통한 시계열 분석의 시사점이 어떻게 비즈니스에 활용될 수 있는지에 대한 구체적인 지침을 제공합니다.
퍼널 및 리텐션 분석 피드백: 퍼널 분석과 리텐션 분석에 대해 유사한 과제를 수행하는 분들에게 피드백하는 과정에서 얻은 인사이트를 공유하고 있습니다. 퍼널 단계에서의 유저 행동 흐름을 평가하는 방법에 대해 더 깊이 있는 설명을 볼 수 있습니다.
리텐션 분석 전략: 리텐션 분석에서 흔히 간과할 수 있는 요소들을 짚어보는 글로서, 데이터 기반의 해석을 위한 전략적 접근 방식을 제시하고 있습니다. 코호트 분석이 사용자 유지에 미치는 영향에 대해 고민해볼 수 있는 기회를 얻으실 수 있습니다.
위 게시물들을 통해 과제의 분석 방법과 해석 방식에 대한 보완점을 찾으실 수 있을 것이라 생각됩니다. 질문자님의 분석 과정이 데이터를 기반으로 공정하게 진행되고 있는지 확인할 수 있도록 도움을 줄 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.






안녕하세요, 세심한 피드백 주셔서 진심으로 감사드립니다.
말씀해주신 내용을 다시 검토해보니, 분석이 데이터 해석에 집중되어 있고 문제 정의와 가설 설정 및 검증 과정이 충분히 반영되지 않았다는 점에 깊이 공감하게 되었습니다. 또한 제가 도출한 인사이트의 경우 현재 보유한 데이터만으로는 검증이 어렵거나, 외부 데이터가 필요한 한계도 존재한다고 느꼈습니다.
시간을 많이 들여 진행한 만큼 아쉬움이 남지만, 이번 피드백을 통해 분석 구조를 보다 명확하게 개선할 수 있는 방향을 배운 것 같아 의미 있게 받아들이고 있습니다.
혹시 프로젝트를 수정한다면,
데이터 해석 → 문제 정의 → (현재 데이터로 검증 가능한 수준의) 가설 수립 → 검증 → 인사이트 도출’의 구조로 재정리하는 방향이 적절할지 여쭙고 싶습니다.
추가적으로 “검색을 한 번이라도 시도한 유저 vs 시도하지 않은 유저의 검색 퍼널 지표를 비교할 수 있다”는 말씀을 주셨는데, 해당 부분에 대해 제가 정확히 이해하지 못한 것 같습니다.
특히, 검색을 시도하지 않은 유저의 경우 검색 퍼널 지표가 어떤 방식으로 산출되는지에 대해 설명을 부탁드려도 괜찮을지 여쭙고 싶습니다.
마지막으로, 번거롭게 해드려서 정말 죄송한데 고객을 new, current, resurrected, inactive, dormant의 다섯 가지 유형으로 분류하였는데, 해당 분류 기준과 방법이 적절한지에 대해서도 검토해주시면 감사하겠습니다.