Label Encoding 방법에 대한 차이
강의를 듣다보니 범주형 데이터일 때, Label Encoding을 하는 방법이 2가지가 있더라고요
from sklearn.preprocessing import LabelEncoder
astype('category').cat.codes
2가지 경우가 결과물에 어떻게 영향을 미치게 될까요?
일단 한 문제로 두 방법으로 인한 roc_auc_score를 검증했을 땐, 유의차가 없었습니다.
답변 1
0
네 현재 기출 문제에서 출제된 데이터로는 차이가 없습니다. 인코딩하는 방식은 매우 다양하고 어떤 방식으로던 인코딩하면 됩니다.
다만 train과 test 카테고리(종류)가 다르다면 합쳐서 인코딩 진행해 주세요!
작업형2 모의문제1 (30강)
0
18
1
수강 기간 연장 문의 드립니다.
0
21
1
수강 계획과 관련해 문의 드립니다.
0
19
1
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
45
2
작업형 1 -연습문제 4-6
0
33
2
작업형 1 유형 부분
0
40
2
작업형 1 (삭제예정, 구 버전)
0
50
2
수강기간 연장 문의드립니다.
0
35
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
36
3
수강기간 연장 문의드립니다.
0
38
1
인덱스 슬라이싱
0
35
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
47
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
62
2
강의 기간 연장 가능여부 검토 요청건
0
50
2
수강기간 연장 문의 드립니다
0
45
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
57
2
수강기간 연장 문의드립니다.
0
60
2
문제 3-2 질문드립니다
0
47
2





