해결된 질문
작성
·
24
0
작업형 3의 문제
## 심장마비 확률이 높은사람?
- 성별, 나이, 혈압, 콜레스테롤, 공복혈당, 최대 심박수 등의 컬럼이 있음
- 평가: ROC-AUC, 정확도(Accuracy), F1 을 구하시오
- target : output (1:심장마비 확률 높음, 0:심장마비 확률 낮음)
- csv파일 생성 : 수험번호.csv (예시 아래 참조)
~~~
위와 같은 문제가 실제 시험 환경에서 문제 양식과 비슷한가요?
저렇게 문제가 나오면 전처리를 어떻게 해야 하는지... 궁금합니다.
만약, 시험 환경 문제가 저렇게 나온다면..
결측치 제거를 그냥 컬럼을 보고 아무 컬럼이나 제거를 해도 되는지. 그게 채점 규정에 맞을지.
그리고 결측치 제거시, fillna()를 쓰는데 아무 값이나 넣어도 되는지. fillna(method='bfill') 이런걸 써도 되는지.
이상치 제거도 그냥 이것도 임의로 뭔가 이상치 인거 같다 싶으면 제거 하는건지..
이게 채점 규정에 맞을지... 애매 한거 같은데요.
============
그리고 혹시나 시험 유형이 저렇게 안나온다면,
문제를 좀 더 명확하게 서술 해주셔야 할 거 같아요
답변 1
0
지금은 학습을 하는 과정으로 여러가지 평가지표를 묻고 있어요. 기출문제를 확인해 주세요 한가지 평가지표로만 평가를 진행합니다.
ROC-AUC, 정확도(Accuracy), F1
그외 문제는 좀 더 자세하게 나오지만 것보다 더 중요한 건 오해하고 있는 것이 있어요!
작업형1과 3은 정답이 있는 문제입니다. 문제에서 제시한 전처리만 처리 합니다.
작업형2는 풀이과정은 자유입니다.
다만 문제에서 제시한 test데이터 결과 예측하고 제출하면
구간별로 배점을 진행합니다:)
그 구간에 대한 기준은 비공개입니다.
작업형2가 처음엔 난해하지만 반복하다보면 제일 쉬운 문제가 될거에요 :)