전처리 방법
작업형 3의 문제
## 심장마비 확률이 높은사람?
- 성별, 나이, 혈압, 콜레스테롤, 공복혈당, 최대 심박수 등의 컬럼이 있음
- 평가: ROC-AUC, 정확도(Accuracy), F1 을 구하시오
- target : output (1:심장마비 확률 높음, 0:심장마비 확률 낮음)
- csv파일 생성 : 수험번호.csv (예시 아래 참조)
~~~
위와 같은 문제가 실제 시험 환경에서 문제 양식과 비슷한가요?
저렇게 문제가 나오면 전처리를 어떻게 해야 하는지... 궁금합니다.
만약, 시험 환경 문제가 저렇게 나온다면..
결측치 제거를 그냥 컬럼을 보고 아무 컬럼이나 제거를 해도 되는지. 그게 채점 규정에 맞을지.
그리고 결측치 제거시, fillna()를 쓰는데 아무 값이나 넣어도 되는지. fillna(method='bfill') 이런걸 써도 되는지.
이상치 제거도 그냥 이것도 임의로 뭔가 이상치 인거 같다 싶으면 제거 하는건지..
이게 채점 규정에 맞을지... 애매 한거 같은데요.
============
그리고 혹시나 시험 유형이 저렇게 안나온다면,
문제를 좀 더 명확하게 서술 해주셔야 할 거 같아요
답변 1
0
지금은 학습을 하는 과정으로 여러가지 평가지표를 묻고 있어요. 기출문제를 확인해 주세요 한가지 평가지표로만 평가를 진행합니다.
ROC-AUC, 정확도(Accuracy), F1
그외 문제는 좀 더 자세하게 나오지만 것보다 더 중요한 건 오해하고 있는 것이 있어요!
작업형1과 3은 정답이 있는 문제입니다. 문제에서 제시한 전처리만 처리 합니다.
작업형2는 풀이과정은 자유입니다.
다만 문제에서 제시한 test데이터 결과 예측하고 제출하면
구간별로 배점을 진행합니다:)
그 구간에 대한 기준은 비공개입니다.
작업형2가 처음엔 난해하지만 반복하다보면 제일 쉬운 문제가 될거에요 :)
빅이시 작업형2 기초 - 케이스 1~3 관련 문의
0
4
1
데이터프레임 슬라이싱 인덱싱 질문2
0
11
1
단일표본검정, 샤피로검정, 윌콕슨검정
0
20
2
강의자료 다운로드 여부
0
18
1
문제에 첨부된 예시와 실제 출력된 샘플 비교
0
15
2
원핫 인코딩 관련
0
26
2
타겟 분리
0
22
2
Id 삭제
0
25
2
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
23
2
원핫인코딩 코드 질문
0
22
2
map 함수 사용 필수적인가요
0
31
2
수강 기한 연장 문의드립니다.
0
39
2
34강 평가지표
0
32
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
23
3
작업형1_section14 문의
0
20
2
작업형1_연습문제 7번 관련입니다.
0
24
2
데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.
0
22
2
크로스 밸리데이션 질문
0
25
2
로지스틱 회귀분석 질문
0
26
2
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
29
2
2유형 object 컬럼 인코딩 관련 질문
0
44
2
하이퍼파라미터 변수
0
35
2
52강 이원분산분석
0
32
2
실제시험환경에서 작업형1,2,3의 문제풀이 순서
0
39
2





