작업형2 모의문제2 질문
히스토그램이랑 describe로 확인한 price 값 중에 굉장히 멀리떨어져있는 값이 나왔는데, 이건 이상치로 해석하는게 아닌가요?'
그리고 강의에서 r 2값이 0.077이 나왔는데. 이게 평가 지표에서 좋게 받을 수 있는건가요?
R에서는 상관관계랑 *** 로 변수를 선택하는게 있었던거 같은데, 파이썬에서는 그냥 진행해야하는건가요?
답변 1
0
hist를 찍어볼 수가 없어서 시험에서는 이상치를 찾는 것은 쉽지 않을 것 같아요!
제거 한다면 좋겠지만 어렵다면 그대로 진행하는 것을 추천합니다.
선형회귀(리니어 리그레이션)모델을 사용한다면 변수(피처)선택이 필요
랜덤포레스트, lightgbm을 사용한다면 중요도를 알아서 낮게 잡아요!
평가 지표는 객관적으로 또는 비교할 수가 없는 환경이에요!
따라서 본인 베이스라인보다 조금 더 점수가 좋게 나오는 방향으로 전처리 또는 튜닝하면 됩니다.
기출 11회 작업형 2_전체 데이터 학습 여부
0
11
1
예측값 결과 소수점 차이
0
16
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
13
0
전처리 train() test([ ])
0
14
2
작업형 1 배경지식 질문
0
17
2
옳게 풀은건지 질문드립니다!
0
13
1
roc_auc_score
0
22
2
추가질문 합니다
0
13
2
시험환경 구름
0
16
2
2유형 질문드려요
0
13
2
RandomForest vs lgb
0
22
2
전처리 관련질문
0
21
3
작업형3 기출
0
15
2
유형2에서 데이터분할 생략 가능여부
0
27
2
9회 기출 유형3 질문
0
17
2
lgb 기초편
0
12
1
괄호 사용
0
20
2
작업형 2 데이터 전처리 질문
0
21
1
11회 기출 유형 작업형1 문제 3-1
0
17
1
예시문제 작업형2 (ver2023) 질문입니다
0
19
2
Data type에 따른 처리
0
20
2
데이터 전처리 관련
0
17
2
시험에서 문제 불러오기
0
18
2
2번문제 출력값 질문
0
25
2





