인프런 커뮤니티 질문&답변
분류 파트 신용카드 사기 실습 예제 2 강의에 대해 질문이 있습니다.
해결된 질문
작성
·
175
1
강의: 분류실습 2: 신용카드 사기 예측실습 - 02
위의 강의 내용 중 예측 알고리즘을 다양하게 사용하는 부분에서 약간 의아한 점이 있습니다.
분류(Classification)은 어떤 입력이 들어왔을 때 그것이 어떤 범주에 속하는지 예측하는 것이고,
회귀(Regression)은 이전의 연속적인 데이터들을 학습하여 미래의 값을 예측하는 것으로 알고 있습니다.
그런데 신용카드 사기 데이터는 연속적인 값이 아니라 해당 건이 '사기 인지 아닌지'를 판단하는 분류 문제 아닌가요?
어떻게 LogisticRegression을 적용할 수 있는지 궁금합니다.
답변 3
2
안녕하십니까,
알고 계신대로 회귀는 연속값을 예측하고, 분류는 이산값(범주값)을 예측합니다만 조금 더 속을 들여다 보면 칼로 무우 자르듯이 나누기 애매한 부분입니다.
5장 회귀에서도 말씀드릴 예정입니다만, 회귀도 Classification이 가능합니다.
Classification의 경우 최종적으로는 클래스값(이산값, 범주)를 예측합니다. 하지만 최종 클래스를 예측하기 전에 개별 클래스들에 대해서 예측 확률값을 계산하여 이들 중 가장 큰 확률을 가진 클래스를 예측하는 것이 일반적인 Classification의 방식입니다. 여기서 예측 확률값은 이산값이 아닌 연속 값입니다.
이런 방식으로 회귀도 classification이 가능합니다. 단 선형함수의 경우 확률을 예측하기에 적합하지 않아서 Linear Regression은 classification에는 잘 사용하지 않습니다만 Logistic Regression은 다릅니다. Logistic Regression은 시그모이드 곡선을 사용하는데 이 시그모이드 곡선은 확률을 근사하는데 뛰어난 기능을 가지고 있습니다.
5장의 Logistic Regression에 해당 내용이 있으니 참조하시면 도움이 될 것 같습니다.
감사합니다.
1
0
답변 주셔서 감사합니다.
답글을 읽으며 다시 생각해보니 말씀하신대로 이해가 되었습니다.
해당 강의의 질문은 아니긴 하나 답변 주시면 감사하겠습니다.
사실 저의 머신러닝 학습의 최종목표는 컴퓨터 비전인데 얼마전에 '딥러닝 컴퓨터 비전 완벽 가이드' 강의를 만드신 것으로 알고 있습니다.
이 강의를 수료하고 해당 강의로 넘어갈 것 같은데 따로 도서가 발행되지 않았나요? 아니라면 추후에 출시할까요?





