라벨인코딩 원핫인코딩 질문드립니다.
라벨인코딩이랑 원핫인코딩의 경우 X_train의 데이터 타입
확인 시 object 형 컬럼이 있을때만 시행하는게 맞는걸까요?
만약 전체 컬럼이 int형 또는 float 형일때는 안해줘도 되는건가요?
만일 X_train 데이터에는 object 컬럼이 없는데 X_test 데이터에는 object 컬럼이 있어도 라벨인코딩 또는 원핫인코딩을 시행해줘야되는걸까요?
추가적으로 데이터 분리의 경우 언제 사용해주는건가요?? 작업형 2유형에서 무조건적으로 사용해줘도 문제없는건지 아니면 사용할 조건이 있는건지 궁금합니다 ㅠㅠ
답변 1
0
네!
입문자에게는 "네", / 중급자에게는 "아니요" 숫자지만 카테고리형인 경우도 있습니다.
그런 경우는 없습니다.
어떤 데이터 분리를 말하는 걸까요? 검증 데이터 분리라면 하는 방법을 추천드립니다. 하지 않으면 성능을 알지 못한채 제출하게 됩니다. 작업형2는 패턴이 있어서 작업형1, 3에 비해 처음엔 코드량이 많아 어렵더라도 몇 번 반복하다보면 쉽다고 느껴질 거에요
작업형2 카테고리
0
7
1
110강 회귀_8번 문의
0
8
2
XGBRegressor 학습 시 warning 출력
0
13
2
데이터 프레임을 변경해도 되나요?
0
10
2
10회 기출 작업형3 문제 2-1 질문
0
15
2
작업형 2 질문
0
15
2
작업형 2 템플릿 확인 요청
0
13
2
작업형2 인코딩 질문
0
22
2
작업형 3 벼락치기 공부방법 질문
0
30
2
기출 11회 작업형 2_전체 데이터 학습 여부
0
31
2
예측값 결과 소수점 차이
0
28
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
35
1
전처리 train() test([ ])
0
23
2
작업형 1 배경지식 질문
0
32
2
옳게 풀은건지 질문드립니다!
0
22
1
roc_auc_score
0
30
2
추가질문 합니다
0
22
2
시험환경 구름
0
20
2
2유형 질문드려요
0
21
2
RandomForest vs lgb
0
28
2
전처리 관련질문
0
29
3
작업형3 기출
0
20
2
유형2에서 데이터분할 생략 가능여부
0
33
2
9회 기출 유형3 질문
0
21
2





