Inflearn コミュニティ Q&A
6-7. 데이터 로그설계 연습 문제 제출합니다!
解決済みの質問
作成
·
49
回答 3
0
솔의눈님 안녕하세요! 과제 푸시느라 고생하셨습니다!
하나씩 의견 드려볼게요
문제1. 기능 잘 동작하는지?
추천배너1을 클릭하는 경우를 click_recommend_1으로 해주셨는데 보통 이런 이름을 사용하지 않습니다
그 이유는 추천배너 1이라는 것이 언제 1이 아닐 수 있기 때문입니다. 숫자로 쓰는 것은 명시적이지 않기 때문에 자주 활용되진 않습니다
또한 event_name에 배너 id까지 넣으신건데, 저라면 차라리 click_banner라는 이벤트를 만들고 banner_id를 이벤트 파라미터로 넣을 것 같습니다. 그러면 정보는 동일하거든요. 배너가 추가되어도 파라미터로 넣을 수 있게 됩니다
문제 1번은 해당 페이지에 있는 모든 기능들을 어떻게 동일한 관점으로 비교할 것인가?를 다룬 문제입니다. 따라서 특정 기능만 선택하는 것이 아니라 각 기능들을 비교할 수 있는 공통적인 지표를 만드는 것이 핵심입니다
주문 전환율의 경우 배너가 어떤 것인지에 따라 다를 것 같아요. 쿠폰 배너일 수도 있지만, 공지 배너일 수도 있고 배너 타입에 따라 주문이 있는지 없는지가 달라질 것 같아요. 그래서 이 지표를 한다면 배너 타입도 추가해야 하는데, 복잡해질 가능성이 있어 저는 먼저 고려하진 않을 것 같아요
배너 파라미터에 food_name, food_description은 어떤 것일까요? 요 부분이 헷갈리네요
지표 정의하실 때 분자 분모는 잘 설정하셨습니다. 이렇게 계속 시도하시면 되어요
지표를 정의하실 때, 왜 이 지표를 선택했는지도 같이 기록해주시면 더 좋아요. 목적을 같이 명시하면 다른 사람들도 왜 이 지표인지 이해하기 수월해집니다.
view_home 이벤트에 has_address는 어떤 목적인가요? 보통 이런 정보는 유저의 프로퍼티로 뺍니다(유저의 정보로) 이벤트가 발생할 때마다 생기는 정보가 아니라 유저에게 저장된 데이터기 때문에 저라면 이건 유저 프로퍼티를 사용할 것 같아요
만약 유저 프로퍼티에도 있는 데이터를 중복으로 저장하고 싶다면, 목적이 명확해야 합니다(어떤 지표에서 쓰일지 등) 지금은 해당 파라미터는 사용되지 않고 있네요
3. [추천배너2] ㅡ 주요 지표 ① 평균 ETA와 추천배너2 ETA 비교
여기서 ETA를 생각하셨군요! ETA 지표는 배달 서비스에서 중요한 지표긴 합니다. 다만 왜 동네맛집에서 이 지표를 봐야 할까요? 동네맛집이 더 가깝다는 가설이 있었을까요?
ETA 정보는 유저의 로그 데이터가 아니라 서버 로그를 보는 경우가 더 많습니다. 서버엔 데이터베이스의 어떤 값이 언제 바뀌었는지가 기록되기 때문에, 그걸 바로 쓰거나 order DB에 별도의 컬럼으로 기록되어 있을 수 있습니다
왜 ETA인가?라는 관점이 명확하면 더 좋겠습니다.
배달 서비스는 전체적으로 ETA가 중요하고, 동네 맛집이라고 해서 더 중요할까?라는 생각을 해보는 것이 필요할 것 같아요
4. [추천배너2] ㅡ 주요 지표 ② 추천배너2 클릭율
여기서 view_home에 recommend_model : random으로 되어있는데 이건 어떤 의도인가요? 추천 모델을 위하서라면 별도로 서버 로그로 기록하는 경우가 더 많습니다. 유저 로그는 유저의 행동 관점으로 로그를 남기는 편입니다
그리고 view_home 을 홈 화면 노출 횟수라고 해주신 것 같은데, 엄밀히 말하면 홈 화면 진입 수입니다. 노출이라는 것은 정의가 살짝 다릅니다. 배너 같은 경우에 노출이라고 많이 씁니다(배너는 시간이 지나면서 자동으로 넘어가는 경우도 있기 때문에)
문제 2. 검색 만족도 지표
검색 후 최종 주문 전환율이라고 해주셨는데 결국 검색 주문 전환율을 의미하는 것 같아요. 최종이란 단어가 있으면 최종이 아닌게 있나? 라는 생각이 드네요
검색 결과 0건 비율은 알고리즘 관점의 지표인 것 같아요.
검색 만족도 지표는 알고리즘 관점의 지표가 있는데, 아래 글 참고해보셔요
검색 이탈률은 검색하고 이탈한 비율인가요? 이런 경우라면 이탈보다 명확하게 검색하고 클릭한 비율을 추적할 것 같아요. 1에서 CTR을 뺀다거나 하면 사람들이 이해하는 것이 어려운 경우가 있더라구요(결국 같은 지표를 의미하므로)
complete_order 이벤트의 파라미터로 user_id를 넣으셨는데, 보통 유저의 로그 데이터엔 모든 이벤트에 기본적으로 user_id가 추가됩니다. 따라서 이벤트의 파라미터로 user_id를 넣을 필요가 없습니다(이벤트의 파라미터 : 이벤트의 정보만 저장한다고 생각해주시면 됩니다) 또한 user_id를 u_1111 이런 형식으로 해주셨는데 u를 쓰신 이유가 있을까요? 아마 현재 회사에서 그런 형태로 저장해서 해주셨을 것 같은데, id는 숫자로 작성하는 것을 더 추천합니다(물론 회사의 id 형태를 따라가긴 해야겠지만..!)
view_search_result
여기서 use_search 파라미터는 왜 있을까요? 이벤트 네임 자체가 view_search_result면 모두 다 search를 통한 것일텐데 이 값이 또 있는 이유가 궁금합니다
food_source에 research_result라고 되어있는데 research는 무엇인가요? search일까요? 이런 정보를 다 넣어달라고 하면 클라이언트 개발자쪽에서 데이터를 저장하고 있어야 해서(화면이 바뀌어도 계속 저장하고 있어야 해서) 선호하지 않을 수 있어요. 이건 명확하게 사용될 이유가 있으면 좋을 것 같아요
is_suggest_keyword는 어떤 값일까요? 트래킹 시트에도 작성되어 있진 않네요.
session_id 있는 것은 잘하셨습니다! 이렇게 하면 같은 세션인지 확인할 수 있어요
region_code는 왜 존재할까요? 어떤 목적으로 로그를 심으신 것인지 궁금하네요
문제 3. 검색 필터 기능의 활성화 지표
검색 필터 사용률 = 필터가 1개 이상 적용된 검색 결과 화면 노출 횟수/전체 검색 결과 화면 노출 횟수
위와 같이 정의해주셨는데, 사용률이라고 하면 검색 필터 클릭 수 / 검색 필터 노출 수
이렇게 정의하면 될 것 같아요. 노출 횟수와 노출 횟수가 있는데, 노출이라는 것이 위에서 말씀드린 것처럼 view랑 정의가 살짝 달라서 헷갈리네요(노출은 홈 화면에 갔다가 다시 화면 진입할 때 찍히게 하는 경우도 있어요)
사용이라는 것은 명확하게 클릭을 했을거라서 클릭을 쓰는 것을 추천드려요
혹은 노출 횟수를 쓰신 이유가 있으려나요?
2. 개별 필터 활용 비율
이 지표는 결국 어떤 필터를 얼마나 클릭했는가라서 각 필터 클릭 수를 세면 될 것 같아요. 지금은 여러개 필터에 대한 지표를 구하라고 하지 않아서 일단 더 생각하지 않고 필터 사용에만 초점을 맞추셔도 괜찮아요
3. 필터 사용 유무 CTR 비교
여기서 갑자기 A와 B가 나옵니다. 그 이유는 무엇일까요?
AB Test 이야기는 아니라서 지표만 정의해주시면 되어요
AB Test를 할 때 A와 B 집단에 따라 로그 정의가 달라지면 안됩니다. 로그를 동일하게 저장해야 비교를 할 수 있어요. 지금 view_search_result가 그룹 A엔 filter_id가 있고 B엔 filter_id가 없네요.
이렇게 작성하고 공유해주셔서 감사합니다! 정리해보면
지표의 목적을 같이 기록해주시면 좋을 것 같아요
지표를 많이 만드는 것보다 핵심 1-2개의 지표만 있어도 충분합니다
보시다가 추가적으로 이것도 필요할 것 같은데?라고 생각하며 지표를 더 추가하는 것은 "목적"에 맞게 했는지 고민해보시면 결정할 수 있을 것 같아요
고생하셨습니다!
0
0
안녕하세요, 인프런 AI 인턴입니다. 솔의눈님!
데이터 로그 설계 연습 문제를 노션과 구글 스프레드시트로 잘 정리하여 제출해주셨네요. 로그 설계는 데이터 분석 및 이해에 있어서 중요한 부분 중 하나입니다. 제공해주신 링크를 통해 카일님께서 피드백을 주실 수 있을 것입니다. 해당 강의와 관련된 비슷한 질문과 답변들을 공유해 드릴테니 참고해 보세요.
6-7 Foodie Express 데이터 로그 설계 연습 문제 풀어보았습니다!
- 질문 내용 및 피드백을 통해 초기 로그 설계 방법과 개선 방안에 대해 배울 수 있습니다.
- 질문 내용 및 피드백을 통해 초기 로그 설계 방법과 개선 방안에 대해 배울 수 있습니다.
-
- 로그 설계 자체와 관련된 다양한 방법론과 접근 방법을 확인할 수 있습니다.
- 로그 설계 자체와 관련된 다양한 방법론과 접근 방법을 확인할 수 있습니다.
로그 설계 시, 어떤 도구에서 로깅을 하는지, 데이터를 어떻게 분석하는지, 확장성 관점에서 어떤 전략을 취할 지 등이 모두 고려되어야 합니다. 이러한 관점들을 통해 제출해주신 계획서를 검토하시고, 적절한 피드백을 받을 수 있을 것입니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.





