• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

데이터셋이 최종 디테일까지 분기될 수 있는지 없는지 접근방법

22.03.11 17:11 작성 조회수 167

0

안녕하세요. 선생님께서 강의해준 내용을 토대로 레코드(카운트수)를 통해 최종 디테일까지 분기될 수 있는지 없는지 확인하고자 하는데요. 제가 실습한 superstore 데이터를 토대로 해보았을 떄, customer name, product name를 행에 두고 카운트를 마크에 뒀을 때, 카운트 수가 1~2까지라고 하는데 이럴 경우 최종 분기가 불가능한 케이스인가요?
카운트가 2인 데이터를 하나 자세히 들여다봤을 때, 다음과 같이 나타났는데 여기서 어떤 힌트를 얻을 수 있는 방법은 계속해서 연습해야 되는건가요? 혹시 팁이 있을까요?

답변 1

답변을 작성해보세요.

1

superstore 데이터셋의 최종 디테일은 order id + product id(or name) 입니다. 고객과 제품을 함께 넣었는데도 count가 2까지 나왔다고 하면 조금 의아하네요

 

어쨌든 superstore 데이터셋의 order table은 이보다 더 구체적으로 쪼개지지는 않습니다.  말씀하신대로 더 이상 분기되지 않습니다. final detail 레벨에 다다른 것이죠

 

카운트가 2인 데이터를 눈으로 직접 확인하는 것도 정석대로 잘 하신 것입니다. 만약 order id와 product name을 넣어서 일부 몇개만 제외하고 카운트 = 1을 확인하셨다면 여기서부터는 해석의 문제입니다. 두 필드를 넣었을 때 데이터 원본이 더 이상 (거의) 쪼개지지 않는 수준에 이르렀다면, 이 데이터셋 row의 의미를 "주문된 제품", 즉 장바구니 제품으로 해석하시면 됩니다

 

다양한 데이터셋을 가지고 이런 연습을 많이 해보신다면, 만들고 있는 숫자가 어떤 의미를 가지는지 더 정확하게 해석하실 수 있을겁니다 ^^ 

박규영님의 프로필

박규영

질문자

2022.03.12

네 29개의 행이 COUNT가 2더라구요 ㅜㅜ이상하네요...

그래도 제 접근법이 맞다니 다행이네요! 감사합니다. 앞으로도 계속 연습해보겠습니다 ㅎㅎ