inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

가우시안 나이브 분류로 이해하는 머신러닝 원리

가우시안 나이브 분류로 이해하는 머신러닝 원리 - 질문

316

문환룡

작성한 질문수 20

0

4분 16초에서
"문제 : 메일에 쿠폰 또는 주식 이라는 단어가 들어있는 메일이 스팸일 확률은?" 은
P(spam|couponstock) 아닌가요?
그래프에는 P(couponstock|spam) 으로 예시가 나와 있어서 다른거 같아서 질문드립니다
같은 방식으로
7분 36초 에서도
나이브 베이즈 분류 예시 수학식은
P(spamcoupon) *P(spamstock) 으로 나와 있는데
그래프는 P(couponspam)P(stockspam) 으로 표시가 되어 있어서 다른거 같아 질문 드립니다.

머신러닝 배워볼래요? python pandas kaggle

답변 1

0

잔재미코딩 DaveLee

문제는 사후확률을 구하는 것인데요.

그렇다면, P(원인|결과) 라고 볼 수 있고,

그래프에서는 원인이 coupon 과 stock 이고, 결과가 spam 임을 나타내서 다음과 같이 표시하였습니다.

(사전확률과 사후확률이 원인, 결과 순서만 다르기 때문에, 이 부분이 저도 헷깔려서, 공유드린 자료에서도 이 부분을 강조하기 위해, 색깔을 갈색으로 강조하는 경우가 많았습니다.)

 P(couponstock|spam)

또 이를 계산할 때 쓰는 나이브 베이즈 수학식은 다음과 같이 사전확률을 가지고, 사후확률을 계산하는 식이라서, 사전확률로 표시한 것이고요. 그래프는 사후확률을 나타낸 것인데, 문서에 사전확률만 표시가 되고, 그래프에는 사후확률이 표시되어서, 조금 헷깔릴 수 있는 것 같습니다. 그래서, 해당 자료에 해당 부분을 바로 업데이트하였습니다. 혹시라도, 제가 그래도 잘못 설명이 되었을 수도 있을 것 같은데, 만약에 그렇다면, 괜찮으시다면, 한번 dream@fun-coding.org 로 어느 챕터, 어느 부분에서 제가 설명한 부분이 문제인지만 다시 알려주시면, 다시 한번 확인해서, 필요하다면 영상 수정도 하겠습니다.

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

96

1

고차원 데이터 질문

0

82

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

215

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

229

1

sklearn v1.5.1

0

175

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

181

2

missingno 대체

0

172

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

134

1

환불문의

0

271

1

자료공유를 받으려고 하는데 에러가 납니다.

0

165

1

iplot에서 항상 에러나는 분 안계신가용?

0

232

1

사망 여부 영향 가능성

0

147

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

194

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

286

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

251

1

3강 강의 자료 코드 관련 질문입니다

1

343

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

421

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

884

2

Bayesian Optimization LightGBM 적용

0

462

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

217

1

강의 중 에러 질문

0

748

1

cross_val_score 에러

0

467

1