머신러닝 2장 질문입니다
162
작성한 질문수 1
머신러닝을 처음 접하고, 완벽가이드 책과 강사님의 강의를 매우 잘 듣고 있는 수강생입니다.^^ 아직 머신러닝 유아 단계라 몸에 안익숙하긴 하지만, 궁금한게 있어 글 남깁니다!
타이나닉 생존자 예측 부분에서 (데이터 전처리 ->...->예측 수행 -> 평가)이런 흐름으로 코드를 진행하셨는데, 결론이 과연 제가 생각하는게 맞는가 갑자기 의문이 생겼습니다.
질문은 우선,
141P에 중간 단락 첫 문장에 생존자를 예측해보겠습니다. 라고 나와 있는데, 생존자 예측이 현재 사용된 ML 알고리즘의 00% 가 예측의 정도 인거 같은데, 그렇다면!!
가령 임의의 feature 값 은 다음과 같이 정의하고( passengerid = 1 , sex=여, cabin=c 등) , label 값은 미지수로 두었을 경우 '예측 수행 및 best 파라미터의 ML 의 알고리즘' 을 통해 임의의 값을 둔 탑승자의 생존여부 (label = survived)를 알 수 있다는 건가요?
아니면, 단순 datasets을 통해 예측 수행 및 best 파라미터의 ML 알고리즘의 정확성만 나타낼 수 있는 건가요?
이상입니다.
항상 좋은 강의 감사합니다~^^
답변 1
0
안녕하십니까,
예측의 정확도는 일종의 시험 결과라고 보시면 될 것 같습니다.
가령 문제(피처)와 답(타겟)으로 된 데이터 세트로 알고리즘을 학습 시킨 뒤 충분히 학습된 알고리즘을 이용하여 이번에는 문제만 내어서 얼마나 정확하게 답을 맞추는가 입니다. 100문제를 내어서 100문제 다 맞추면 100점(100% 정확도), 90문제 맞추면 (90% 정확도).
또는 임의의 데이터 세트로 예측해 보았을 때 탑승자의 생존/사망 여부를 맞출 확률이 90%라고도 볼 수 있습니다. 이때 임의의 데이터 세트는 반드시 학습된 데이터 세트와 같은 feature들로 이뤄진 데이터 세트여야 합니다.
감사합니다.
안녕하세요 열심히 수강중인 학생입니다
0
60
2
정수 인덱싱
0
68
2
넘파이 오류
0
83
2
11강 numpy의 axis 축 질문 드립니다.
0
85
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
77
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
69
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
75
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
64
2
5강 강의 오류가 있어요.
0
83
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
72
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
69
3
파이썬 다운그레이 후 사이킷런 재설치
0
116
2
좋은 강의 감사합니다.
0
72
2
scoring 함수 음수값
0
67
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
99
2
분류 평가 정확도 예측
0
76
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
98
1
카카오톡 채널 있나요
0
106
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
189
2
pca 스케일링 관련하여 질문드립니다.
0
100
2
주피터 대신 구글 코랩
0
171
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
146
2
실루엣 스코어..
0
84
2
float64 null 값 처리 방법
0
102
2





