-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
머신러닝 2장 질문입니다
21.01.04 13:47 작성 조회수 96
0
머신러닝을 처음 접하고, 완벽가이드 책과 강사님의 강의를 매우 잘 듣고 있는 수강생입니다.^^ 아직 머신러닝 유아 단계라 몸에 안익숙하긴 하지만, 궁금한게 있어 글 남깁니다!
타이나닉 생존자 예측 부분에서 (데이터 전처리 ->...->예측 수행 -> 평가)이런 흐름으로 코드를 진행하셨는데, 결론이 과연 제가 생각하는게 맞는가 갑자기 의문이 생겼습니다.
질문은 우선,
141P에 중간 단락 첫 문장에 생존자를 예측해보겠습니다. 라고 나와 있는데, 생존자 예측이 현재 사용된 ML 알고리즘의 00% 가 예측의 정도 인거 같은데, 그렇다면!!
가령 임의의 feature 값 은 다음과 같이 정의하고( passengerid = 1 , sex=여, cabin=c 등) , label 값은 미지수로 두었을 경우 '예측 수행 및 best 파라미터의 ML 의 알고리즘' 을 통해 임의의 값을 둔 탑승자의 생존여부 (label = survived)를 알 수 있다는 건가요?
아니면, 단순 datasets을 통해 예측 수행 및 best 파라미터의 ML 알고리즘의 정확성만 나타낼 수 있는 건가요?
이상입니다.
항상 좋은 강의 감사합니다~^^
답변을 작성해보세요.
0
권 철민
지식공유자2021.01.05
안녕하십니까,
예측의 정확도는 일종의 시험 결과라고 보시면 될 것 같습니다.
가령 문제(피처)와 답(타겟)으로 된 데이터 세트로 알고리즘을 학습 시킨 뒤 충분히 학습된 알고리즘을 이용하여 이번에는 문제만 내어서 얼마나 정확하게 답을 맞추는가 입니다. 100문제를 내어서 100문제 다 맞추면 100점(100% 정확도), 90문제 맞추면 (90% 정확도).
또는 임의의 데이터 세트로 예측해 보았을 때 탑승자의 생존/사망 여부를 맞출 확률이 90%라고도 볼 수 있습니다. 이때 임의의 데이터 세트는 반드시 학습된 데이터 세트와 같은 feature들로 이뤄진 데이터 세트여야 합니다.
감사합니다.
답변 1