inflearn logo
강의

Course

Instructor

[Revised Edition] The Complete Guide to Python Machine Learning

Introduction to Classification and Decision Trees

결정트리 질문

392

HAHA

52 asked

0

안녕하세요.

결정트리 분류 구현 질문드립니다.

4분19초에 있는 그림들을 보면

규칙 노드가 있고 거기에 대한 결정 분류값이 있다고 이해했습니다.

만약 제가 결정트리기반인 모델을 가지고

사용자 특성(ex 나이, 성별, 현재 상태 등)을 가지고 다음에 할 행동을 분류한다고 했을 때,

같은 특성을 가진 사람이라 해도 다음 행동이 다를 수 있다고 생각됩니다.

이럴 때는 결정트리를 사용하면 안되는 것인가요?

 

음 요약하자면

 입력 특징들이 같고 class가 다른 경우 사용할 수 없나요??

해당 문제를 풀기 위해서 결정 트리로 접근하는 것은 잘못된 방향일까요?

 

ex.

input                               label

남자 21세 치킨먹음 -> 마실 것을 먹음

남자 21세 치킨먹음 -> 손을 씻음

이런 특성을 가지고 가장 높은 확률로 이 행동을 하겠다 하는 것을 예측하고 싶습니다!

 

옳바른 비교인지 모르겠지만, 뒤에서 본 사용자 행동 인식 데이터에서는 같은 입력과 다른 출력이 있는데도 사용한 것일까요??

 

강사님 강의를 보고 너무 좋아서 복습용으로 책도 구매했습니다!!

좋은 강의와 책 만들어주셔서 감사드립니다!ㅎㅎ

통계 머신러닝 배워볼래요? python

Answer 2

0

HAHA

=> 위 2개의 데이터로 학습한 모델에서 만약 남자 21세 치킨먹음 이라는 데이터가 들어오면 예측을 뭘로 하기를 원하시는 건지요?

다음 행동을 뭘 할지 예측하고 싶습니다.

 

똑같은 특성을 가진 사람이어도 다른 행동을 할 것 같은데, 그래도 많은 행동 패턴을 보이는 행동을 예측하고 싶습니다!

multi label과는 조금 다른 것 같아서요!

 

input

남자 21세 치킨먹음 -> 이런특성을 가진 사람들이 대부분 "마실 것을 먹음" 확률이 높고 다음에는 "손을 씻음"행동을 확률이 높더라 라는 것을 하고 싶습니다!

 

결정트리로 접근하는 것은 강사님이 답변주신 내용을 보니 잘못된 접근 방식인 것 같아서요...

강의 외적인 질문 해서 정말 죄송합니다..

가능하시다면 조언해주시면 정말 감사하겠습니다!

0

dooleyz3525

안녕하십니까, 

책과 강의 모두 잘 보고 계시다니 저도 기쁩니다. 

근데 제가 질문을 제대로 이해한것인지 모르겠습니다. 먼저 

1. 만약 제가 결정트리기반인 모델을 가지고

사용자 특성(ex 나이, 성별, 현재 상태 등)을 가지고 다음에 할 행동을 분류한다고 했을 때,

같은 특성을 가진 사람이라 해도 다음 행동이 다를 수 있다고 생각됩니다.

이럴 때는 결정트리를 사용하면 안되는 것인가요?

input                               label

남자 21세 치킨먹음 -> 마실 것을 먹음

남자 21세 치킨먹음 -> 손을 씻음

이런 특성을 가지고 가장 높은 확률로 이 행동을 하겠다 하는 것을 예측하고 싶습니다!

=> 위 2개의 데이터로 학습한 모델에서 만약 남자 21세 치킨먹음 이라는 데이터가 들어오면 예측을 뭘로 하기를 원하시는 건지요?

일반적인 multi class 모델로는(강의에서 다루는 모든 supervised learning 모델) 위와 같은 방식으로 학습해서는 안됩니다.   동일한 피처면 서로 다른 타겟값으로 학습해서는 안되는게 multi class 모델입니다. 

다만 남자 21세 치킨 먹음 -> (마실것을 먹음, 손을 씻음) 과 같이 여러개의 타겟값을 예측하는 방식은 multi label 모델인데, 이와 같은 방식으로는 적용할 수 있습니다. 

또 다른 multi label 모델의 예를 들자면 특정 문서가 '경제' 또는 '정치'로 특정되지 않고 '경제', '정치' 와 같은 여러 타겟값을 가질 수 있을 때 적용할 수 있습니다. 

원하시는 모델이 혹 multi label 모델을 말씀하시는 건지요? 

안녕하세요 열심히 수강중인 학생입니다

0

58

2

정수 인덱싱

0

66

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

84

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

76

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

68

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

73

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

62

2

5강 강의 오류가 있어요.

0

81

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

71

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

67

3

파이썬 다운그레이 후 사이킷런 재설치

0

115

2

좋은 강의 감사합니다.

0

70

2

scoring 함수 음수값

0

66

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

98

2

분류 평가 정확도 예측

0

75

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

96

1

카카오톡 채널 있나요

0

104

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

187

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

169

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

145

2

실루엣 스코어..

0

82

2

float64 null 값 처리 방법

0

99

2