분류 파트 신용카드 사기 실습 예제 2 강의에 대해 질문이 있습니다.
강의: 분류실습 2: 신용카드 사기 예측실습 - 02
위의 강의 내용 중 예측 알고리즘을 다양하게 사용하는 부분에서 약간 의아한 점이 있습니다.
분류(Classification)은 어떤 입력이 들어왔을 때 그것이 어떤 범주에 속하는지 예측하는 것이고,
회귀(Regression)은 이전의 연속적인 데이터들을 학습하여 미래의 값을 예측하는 것으로 알고 있습니다.
그런데 신용카드 사기 데이터는 연속적인 값이 아니라 해당 건이 '사기 인지 아닌지'를 판단하는 분류 문제 아닌가요?
어떻게 LogisticRegression을 적용할 수 있는지 궁금합니다.
답변 3
2
안녕하십니까,
알고 계신대로 회귀는 연속값을 예측하고, 분류는 이산값(범주값)을 예측합니다만 조금 더 속을 들여다 보면 칼로 무우 자르듯이 나누기 애매한 부분입니다.
5장 회귀에서도 말씀드릴 예정입니다만, 회귀도 Classification이 가능합니다.
Classification의 경우 최종적으로는 클래스값(이산값, 범주)를 예측합니다. 하지만 최종 클래스를 예측하기 전에 개별 클래스들에 대해서 예측 확률값을 계산하여 이들 중 가장 큰 확률을 가진 클래스를 예측하는 것이 일반적인 Classification의 방식입니다. 여기서 예측 확률값은 이산값이 아닌 연속 값입니다.
이런 방식으로 회귀도 classification이 가능합니다. 단 선형함수의 경우 확률을 예측하기에 적합하지 않아서 Linear Regression은 classification에는 잘 사용하지 않습니다만 Logistic Regression은 다릅니다. Logistic Regression은 시그모이드 곡선을 사용하는데 이 시그모이드 곡선은 확률을 근사하는데 뛰어난 기능을 가지고 있습니다.
5장의 Logistic Regression에 해당 내용이 있으니 참조하시면 도움이 될 것 같습니다.
감사합니다.
0
답변 주셔서 감사합니다.
답글을 읽으며 다시 생각해보니 말씀하신대로 이해가 되었습니다.
해당 강의의 질문은 아니긴 하나 답변 주시면 감사하겠습니다.
사실 저의 머신러닝 학습의 최종목표는 컴퓨터 비전인데 얼마전에 '딥러닝 컴퓨터 비전 완벽 가이드' 강의를 만드신 것으로 알고 있습니다.
이 강의를 수료하고 해당 강의로 넘어갈 것 같은데 따로 도서가 발행되지 않았나요? 아니라면 추후에 출시할까요?
안녕하세요 열심히 수강중인 학생입니다
0
63
2
정수 인덱싱
0
68
2
넘파이 오류
0
85
2
11강 numpy의 axis 축 질문 드립니다.
0
85
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
79
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
70
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
75
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
64
2
5강 강의 오류가 있어요.
0
84
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
72
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
69
3
파이썬 다운그레이 후 사이킷런 재설치
0
117
2
좋은 강의 감사합니다.
0
73
2
scoring 함수 음수값
0
67
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
100
2
분류 평가 정확도 예측
0
79
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
99
1
카카오톡 채널 있나요
0
108
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
190
2
pca 스케일링 관련하여 질문드립니다.
0
100
2
주피터 대신 구글 코랩
0
172
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
148
2
실루엣 스코어..
0
86
2
float64 null 값 처리 방법
0
103
2





