• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

Online-retail분석시 Frequency관련질문드립니다

20.11.24 02:30 작성 조회수 81

1

초기 데이터 가공시 Frequency는invoiceNo를count했고,이후 rename하면서 Frequency로 컬럼을 정했는데요.

데이터를 살펴보니 한고객이 어느날 하루에 7개의물건을 주문한것이 각 행별로 하나씩 생성되어있어서 count결과가 7이고, 다른날 각각 다른상품코드 8개를 주문하면 행이 8개가 생성되어 결과적으로 15가 됩니다

그야말로 상품을 종류별로 많이 사면 한날짜에 들어와서 100개의 상품을 산 고객과, 자주들어와서 2개씩, 3개씩 산 고객과 차이가 나지 않는데 괜찮은건가요?

제 생각에는 그 값이 Frequency라는단어적인 의미와는 맞지 않는것 같습니다.

제가 마케팅을 잘은 모르지만 한번들어와서 왕창 산고객보다는 자주 들어오는 loyalty를확인하는거라면 날짜별로groupby하는게 낳은게 아닐지요..

히스토그램도 너무비대칭이고 좀 이상한거 같아요..

만약 책처럼 invoiceNo를 count한다면 그건 주문건수와 관련있어서 Monetary와 종속되는 데이터같습니다 

그만큼 주문을 많이 하면 총액은 늘어나는거니까요..

선생님 좋은 의견 듣고싶습니다

항상 좋은강의감사드려요..ㅎㅎ

답변 1

답변을 작성해보세요.

1

안녕하십니까,

개연성있는 설명이군요.

frequency의 의미에 보다 가깝게 말씀해주신것 같습니다. 특히 제가 말씀드린 frequency는 데이터가 불균일하게 발생한다는 단점도 있습니다.

다만 설명해주신 frequency 부분은 일정부분 Recency하고도 연관이 있습니다. 그리고 제가 말씀드린 부분은 좀더 recency와는 독립적인 특성을 가지고 있습니다.

제가 말씀드린 내용은 고객을 세그먼트하는 하나의 예를 말씀드린것 이었습니다. 말씀하신 부분도 좋은 기준이 될 것 같습니다.  훌륭한 의견 감사드립니다.

감사합니다.