inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런으로 수행하는 타이타닉 생존자 예측 - 02

머신러닝 2장 질문입니다

162

임종욱

작성한 질문수 1

0

머신러닝을 처음 접하고, 완벽가이드 책과 강사님의 강의를 매우 잘 듣고 있는 수강생입니다.^^ 아직 머신러닝 유아 단계라 몸에 안익숙하긴 하지만, 궁금한게 있어 글 남깁니다!

타이나닉 생존자 예측 부분에서 (데이터 전처리 ->...->예측 수행 -> 평가)이런 흐름으로 코드를 진행하셨는데, 결론이 과연 제가 생각하는게 맞는가 갑자기 의문이 생겼습니다.

질문은 우선,

141P에 중간 단락 첫 문장에 생존자를 예측해보겠습니다. 라고 나와 있는데, 생존자 예측이 현재 사용된 ML 알고리즘의 00% 가 예측의 정도 인거 같은데,  그렇다면!!

가령 임의의 feature 값 은 다음과 같이 정의하고( passengerid = 1 ,  sex=여,  cabin=c 등) , label 값은 미지수로  두었을 경우 '예측 수행 및 best 파라미터의 ML 의 알고리즘' 을 통해 임의의 값을 둔 탑승자의 생존여부 (label = survived)를 알 수 있다는 건가요?

아니면, 단순 datasets을 통해 예측 수행 및 best 파라미터의 ML 알고리즘의 정확성만 나타낼 수 있는 건가요?

이상입니다. 

항상 좋은 강의 감사합니다~^^

머신러닝 배워볼래요? python 통계

답변 1

0

권 철민

안녕하십니까,

예측의 정확도는 일종의 시험 결과라고 보시면 될 것 같습니다.

가령 문제(피처)와 답(타겟)으로 된 데이터 세트로 알고리즘을 학습 시킨 뒤 충분히 학습된 알고리즘을 이용하여 이번에는 문제만 내어서 얼마나 정확하게 답을 맞추는가 입니다. 100문제를 내어서 100문제 다 맞추면 100점(100% 정확도), 90문제 맞추면 (90% 정확도).

또는 임의의 데이터 세트로 예측해 보았을 때 탑승자의 생존/사망 여부를 맞출 확률이 90%라고도 볼 수 있습니다. 이때 임의의 데이터 세트는 반드시 학습된 데이터 세트와 같은 feature들로 이뤄진 데이터 세트여야 합니다.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

60

2

정수 인덱싱

0

68

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

77

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

69

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

83

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

116

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

99

2

분류 평가 정확도 예측

0

76

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

98

1

카카오톡 채널 있나요

0

106

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

189

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

171

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

146

2

실루엣 스코어..

0

84

2

float64 null 값 처리 방법

0

102

2