• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

머신러닝 2장 질문입니다

21.01.04 13:47 작성 조회수 96

0

머신러닝을 처음 접하고, 완벽가이드 책과 강사님의 강의를 매우 잘 듣고 있는 수강생입니다.^^ 아직 머신러닝 유아 단계라 몸에 안익숙하긴 하지만, 궁금한게 있어 글 남깁니다!

타이나닉 생존자 예측 부분에서 (데이터 전처리 ->...->예측 수행 -> 평가)이런 흐름으로 코드를 진행하셨는데, 결론이 과연 제가 생각하는게 맞는가 갑자기 의문이 생겼습니다.

질문은 우선,

141P에 중간 단락 첫 문장에 생존자를 예측해보겠습니다. 라고 나와 있는데, 생존자 예측이 현재 사용된 ML 알고리즘의 00% 가 예측의 정도 인거 같은데,  그렇다면!!

가령 임의의 feature 값 은 다음과 같이 정의하고( passengerid = 1 ,  sex=여,  cabin=c 등) , label 값은 미지수로  두었을 경우 '예측 수행 및 best 파라미터의 ML 의 알고리즘' 을 통해 임의의 값을 둔 탑승자의 생존여부 (label = survived)를 알 수 있다는 건가요?

아니면, 단순 datasets을 통해 예측 수행 및 best 파라미터의 ML 알고리즘의 정확성만 나타낼 수 있는 건가요?

이상입니다. 

항상 좋은 강의 감사합니다~^^

답변 1

답변을 작성해보세요.

0

안녕하십니까,

예측의 정확도는 일종의 시험 결과라고 보시면 될 것 같습니다.

가령 문제(피처)와 답(타겟)으로 된 데이터 세트로 알고리즘을 학습 시킨 뒤 충분히 학습된 알고리즘을 이용하여 이번에는 문제만 내어서 얼마나 정확하게 답을 맞추는가 입니다. 100문제를 내어서 100문제 다 맞추면 100점(100% 정확도), 90문제 맞추면 (90% 정확도).

또는 임의의 데이터 세트로 예측해 보았을 때 탑승자의 생존/사망 여부를 맞출 확률이 90%라고도 볼 수 있습니다. 이때 임의의 데이터 세트는 반드시 학습된 데이터 세트와 같은 feature들로 이뤄진 데이터 세트여야 합니다.

감사합니다.