강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

bbbangduk9님의 프로필 이미지
bbbangduk9

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

실무에서 LTV 관련 모델 선택 질문입니다!

작성

·

29

0

먼저 강사님 강의 잘 듣고 있습니다!

다름이 아니라 제가 실무에서 코호트 단위로 리텐션 분석해놓은것을 토대로 LTV를 구하는 작업을 진행중입니다!

그 과정에서 최근 달의 경우에는 리텐션을 예측해서 LTV 구하는데 활용하는 것으로 알고있는데요!

혹시 이 과정에 있어서 어떤 모델을 사용하면 좋을지 여쭙고자 문의사항 남깁니다!

보통의 LTV의 경우에는 BG/NBD 혹은 GAMMA GAMMA 모델을 활용한다고 알고있는데 월 단위 구독 모델의 Retention을 구할때는 잘 안쓴다고 하는 것 같아서요!

강의에는 아쉽게도 관련 내용으로 진행한건 없는거 같아서 물어보는게 맞을까.. 싶긴한데 여쭤볼곳이 없어 한 번 QnA에 남겨봅니다!

답변 2

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

어떤 LTV 모델을 생각하고 계시는지 적어주시지 않아서 잘 모르겠지만, 령 예를 들어서, 90일 기준 LTV 값 예측 모델이라고 한다면 제 생각엔 Timeseries기반의 회귀 모델을 적용하시면 좋을 것 같습니다

다만 이러한 모델을 위해서는 학습 데이터가 필요한데, 과거(예를 들어 1년동안) 고객 행동 데이터, 매출 데이터, 마켓팅 정보, Retention 정보등을 이용해서 구매 패턴, Retention값, 세션수, 클릭수, 구매 상품(또는 구매 카테고리등)을 다양한 Feature를 90일 기준 LTV 값들을 학습 데이터로 만들고 이 학습 데이터를 LightGBM등을 이용해서 추후 90일 LTV 값을 예측하는 모델을 만들면 어떨까 싶습니다.

해당 강의는 회귀 강의를 들어보시면 좋을 것 같습니다.

 

감사합니다.

 

bbbangduk9님의 프로필 이미지
bbbangduk9
질문자

안녕하세요! 월 단위 기반 구독형 모델입니다! LTV는 일단 단순하게 첫출금 기반 Retention 기준 인당 ARPU * Retetion의 합으로 12/24개월치를 구하려고합니다! 이 경우에도 적합할까요??

권 철민님의 프로필 이미지
권 철민
지식공유자

앗, 추가 질문이 있는 것을 놓쳤군요. 답변이 늦어서 죄송합니다.

근데, 머신러닝 모델을 만든다는 것이 "ARPU * Retetion의 합으로 12/24개월치" 와 같은 요건 보다는, LTV를 예측할 수 있도록 좋은 학습 데이터와 피처들을 가지고 있느냐가 더 중요 합니다. 그러니까, ARPU * Retetion의 합으로 12/24개월치는 타겟값(결정값)이 되다 보니, 이건 예측을 하는 결과가 되는 것이고, 이러한 예측을 잘 할 수 있도록 이전 답변에서 언급드린 구매 패턴, Retention값, 세션수, 클릭수, 구매 상품등의 피처들을 가진 학습 데이터가 잘 준비되어 있느냐가 더 중요한 요소 입니다.

요약 드리자면, RPU * Retetion의 합으로 12/24개월치 예측 LTV를 머신러닝 모델 기반으로 구할 수 있습니다. 하지만 이 모델의 학습에 필요한 피처들이 잘 준비되어 있느냐에 따라 성능은 천양지차로 달라 질 수 있습니다

0

안녕하세요, 인프런 AI 인턴입니다. bbbangduk9님.

LTV(고객 평생 가치, Lifetime Value) 모델을 선택하는 데 있어 실무에서는 다양한 접근법을 사용할 수 있습니다. 특정 상황에 따라 알맞은 모델이 다를 수 있는데, 일반적으로 말씀하신 BG/NBD 모델과 Gamma-Gamma 모델은 고객의 생애 가치를 예측하는 데 사용됩니다. 그러나 이들 모델은 주로 이커머스나 비구독형 서비스에서의 고객 행동을 모델링하는 데 적합합니다.

월 단위 구독 모델의 리텐션을 예측할 때는 다른 방법들을 고려할 수 있습니다. 예를 들어:

  1. Survival Analysis: 이 방법은 고객이 서비스를 계속 사용할 확률을 예측하는 데 사용되며, 특히 시간에 따라 고객 행동이 변화하는 패턴을 잘 포착할 수 있습니다. Cox Proportional Hazards 모델이나 Kaplan-Meier 그래프 등이 있습니다.

  2. Recurrent Neural Networks (RNN): 시간의 흐름에 따른 데이터를 다루기 때문에 월별 구독 데이터를 처리하는 데 적합할 수 있습니다.

  3. ARIMA 같은 시간 시계열 모델 및 Prophet은 향후 트렌드를 예측하는 데 유용할 수 있습니다.

LTV를 구하기 위해서는 리텐션을 예측하는 것이 중요하며, 이러한 예측을 바탕으로 고객의 향후 행동을 추정할 수 있습니다. 데이터를 기반으로 여러 모델들을 시도하면서 가장 예측력이 좋은 모델을 선택하는 것이 높은 성과를 위한 핵심입니다.

다음의 링크들을 참고하시면 도움이 될 수 있습니다:
- 모델 선택의 기준: 모델 선택의 기준과 관련된 설명입니다.
- 머신러닝 모델 선택 방법: 다양한 모델을 비교하고 선택하는 과정에 대한 설명이 포함되어 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

bbbangduk9님의 프로필 이미지
bbbangduk9

작성한 질문수

질문하기