원핫인코딩 질문
5회 기출유형(작업형2)에서 수치형+범주형 활용에서
원-핫 인코딩을 실시하실때 범주형 컬럼을 'cols'에 담아 범주형만 실시해야 되는게 아닌가요?
선생님 코딩에는 전체 컬럼을 대상으로 원-핫 인코딩을 하는 게 아닌가요?
train = pd.get_dummis(train) 가 아닌
cols = [범주형 변수들....]
train[cols] = pd.get_dummis(train[cols]) 가 맞는 게 아닌가요?
답변 1
1
ycann님, get_dummies 전과 후를 한번 확인 부탁드려요 :)
판다스 get_dummies는 친절하게도 알아서 인코딩이 필요한 컬럼(피처)만 선택해서 원핫 인코딩을 진행하고 필요없는 수치형 컬럼은 그냥 둡니다. 그래서 전체 데이터를 사용했어요! 👍👍👍
예를들어 수치형 데이터만 가지고 get_dummies를 진행하면 아무일도 일어나지 않습니다:)
본 과정에서 ycann님께서 작성한 질문들의 답변이 되었다면 "해결됨" 체크해주시면 너무 감사하겠습니다 !! 제겐 이전 질문 모두가 미해결로 남아있네요 🙌
작업형 1 유형 부분
0
16
2
작업형 1 (삭제예정, 구 버전)
0
34
2
수강기간 연장 문의드립니다.
0
26
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
25
3
수강기간 연장 문의드립니다.
0
28
1
인덱스 슬라이싱
0
28
2
질문 드립니다.
0
46
2
강의 내용 관련 질문드립니다~
0
43
2
수강 연장 문의
0
57
2
강의자료 일괄 다운로드
0
52
2
수강기간 연장 문의드립니다
0
41
2
list 문제 질문드립니다~
0
35
2
빅분기 실기 12회 재도전
0
54
2
강의 기간 연장 가능여부 검토 요청건
0
39
2
수강기간 연장 문의 드립니다
0
43
2
수강기간 연장 문의드립니다
0
50
2
질문이요
0
56
2
수강기간 연장 문의드립니다.
0
58
2
문제 3-2 질문드립니다
0
47
2
수강기간 연장 문의 드립니다.
0
61
2
변수, 칼럼 , df 구분
0
51
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
49
2
수강기간 연장 문의드립니다.
0
42
2





