실루엣 값을 기준으로 필터한 값을 target값으로 선정
270
작성한 질문수 11
안녕하세요. 교수님.
이번 강의를 보면서 실루엣 값과 각 군집의 평균값에 대개 배웠는데요. 이렇게 구해진 각 값들의 실루엣 계수들에 대해 어느정도 값을 기준으로 필터링하여 해당 클러스터된 각 데이터를 target 값으로 사용하여 다른 데이터의 회귀분석 예측모델을 사용하려는 생각을 조금 해보았는데 이런 진행 방식이 맞는걸까요?
답변 1
0
안녕하십니까,
음, 제가 질문을 잘 이해하지 못했습니다.
질문 하신 내용을 좀 더 상세히 기재해 주시겠습니까? 어떤 값을 피처로 하고, 어떤 값을 Target으로 해서 회귀 모델을 적용하고자 하시는 지요?
0
분류 예측을 하였을 때, Target 값이 정해지지 않은 데이터에서
1차로 특정 설문에 대한 군집분석을 통한 분류된 값을 Target값으로 가집니다. 데이터에서 실루엣값이 좀 높은 기준을 가지고 필터링하여 해당 데이터가 target으로 가집니다.
이제 학습할 데이터는 1차로 군집분석한 피처의 데이터가 있지는 않지만 1차에서 필터링한 데이터의 설문데이터가 아닌 성별 나이 등 이런 피쳐를 통해 군집분석된 target 값을 가지고 학습합니다.
최종적으로 설문 데이터가 없는 데이터의 성별 나이 등의 데이터를 통해 target 값을 예측하려는 방식입니다.
0
이제 학습할 데이터는 1차로 군집분석한 피처의 데이터가 있지는 않지만 1차에서 필터링한 데이터의 설문데이터가 아닌 성별 나이 등 이런 피쳐를 통해 군집분석된 target 값을 가지고 학습합니다.
=> 여기가 잘 이해가 안되는 군요.
군집 분석을 특정 피처로 해서 Target값을 가졌는데, 해당 Target 값을 그대로 두고, 기존 피처는 없애고, 새로운 피처들로 학습을 하겠다는 의미 인지요?
그리고, 이런 방식과 더불어 최종 회귀 모델은 어떻게 만들려고 하시는 건지요?
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
24
2
안녕하세요 열심히 수강중인 학생입니다
0
68
2
정수 인덱싱
0
71
2
넘파이 오류
0
88
2
11강 numpy의 axis 축 질문 드립니다.
0
89
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
80
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
71
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
76
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
65
2
5강 강의 오류가 있어요.
0
86
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
74
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
70
3
파이썬 다운그레이 후 사이킷런 재설치
0
122
2
좋은 강의 감사합니다.
0
75
2
scoring 함수 음수값
0
68
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
104
2
분류 평가 정확도 예측
0
80
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
100
1
카카오톡 채널 있나요
0
110
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
191
2
pca 스케일링 관련하여 질문드립니다.
0
102
2
주피터 대신 구글 코랩
0
174
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
149
2
실루엣 스코어..
0
87
2





