분류 모델 질문입니다.
256
작성한 질문수 4
분류 모델은 타이타닉의 생존자가 살았다 or 죽었다 처럼 2가지의 답중에 하나만 예측하는것만 가능한가요?
예를들어 날씨가 맑음, 흐림, 비, 눈 처럼 4가지 범주에서 예측하지는 못하나요? 할수있다면 어떤 모델을 공부하면될까요?
답변 1
0
안녕하세요.
주요 머신러닝 기법은 기본적으로는 이진 분류를 기반으로 하는데요. 이진 분류를 여러개 넣어서, 다중 분류를 할 수 있습니다.
예를 들어, 이미지를 숫자데이터로 만들어서, 각 이미지가 0 ~ 9 까지 어느 숫자인지 판단하는 기능을 머신러닝 기법으로 만든다면,
본 강의에서 이야기드린 분류 기법을 그대로 써서, 각 이미지가, 0 인지 0이 아닌지, 1 인지, 1이 아닌지와 같이 총 10개의 이진 분류를 해서, 그 중에, 가장 정확도 또는 확률값이 높은 것으로 값을 예측하는 식으로 가능합니다.
이에 대해서는 여러 자료를 봤을 때, 그래도 다음 링크가 가볍게는 잘 설명되어 있는 것 같아서, 참고가 되실 것 같아요.
https://blog.naver.com/ruth0908/222465884884
이외에 KNN 과 같이, 비지도학습을 통해, 그룹핑을 하는 머신러닝 기법을 사용하기도 하고요.
또 딥러닝의 기법을 사용하는 경우도 있습니다. 그래서 이진 분류를 사용하여 다중 분류를 적용하는 기법에 추가적인 성능 평가등등이 필요해서, 이 기법과 관련 평가 지표를 참고해보시면 좋을 것 같고요.
추후에 딥러닝 기법에서 또 다중 분류도 한번 어떻게 하는지 가볍게 익혀보시면 좋을 것 같습니다.
감사합니다.
자료 공유 질문
0
70
1
Ascii 에러 관련하여 질문드립니다
0
97
1
고차원 데이터 질문
0
85
1
세션4 범주형 데이터 분석 패턴 강의 질문
0
217
2
pandas 2.2.2, xgboost 2.1.3 에러 해결 방법
0
235
1
sklearn v1.5.1
0
176
1
머신러닝 적용을 위한 Feature Engineering 작업1
0
185
2
missingno 대체
0
174
1
scikit-learn 1.5.1 matplotlib 3.9.2
0
136
1
환불문의
0
273
1
자료공유를 받으려고 하는데 에러가 납니다.
0
171
1
iplot에서 항상 에러나는 분 안계신가용?
0
234
1
사망 여부 영향 가능성
0
149
1
섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문
0
195
1
df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?
0
288
1
주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문
0
252
1
3강 강의 자료 코드 관련 질문입니다
1
344
1
맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.
0
428
1
Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.
0
887
2
Bayesian Optimization LightGBM 적용
0
469
2
하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.
1
347
1
중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3
0
218
1
강의 중 에러 질문
0
756
1
cross_val_score 에러
0
470
1





