레이블인코딩 합쳐서 하는 기준 판단
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
안녕하세요!
set 방법이 이제 생각나서 다시 돌아와서 보고 있습니다.
set으로 확인하는 과정은 EDA에서 해주는게 맞죠?
a = set(train['object컬럼명'].unique())
b = set(test['object컬럼명'].unique())
이렇게 정의 해주었을때
test에 있는데 train에 없는 경우만 예외경우로 합쳐서 레이블 인코딩 해줘야하니
print(b-a) 만 해주면 되는거 맞죠? (굳이 a-b는 안해줘도되나 싶어서요)
이 값이 어떤 값이 나오면 합쳐서 레이블 인코딩 해주고 분리해주는거구요!만약 합친 다음에 레이블 인코딩 해줘야한다면
<전처리 단계>target = train.pop('타겟컬럼') from sklearn.preprocessing import LabelEncoder cols = train.select_dtypes(include='object').columns df = pd.concat([train,test]) for col in cols: le = LabelEncoder() df[col] = le.fit_transform(df[col]) train = df.iloc[:len(train)] test = df.iloc[len(train):]
이 순서대로 진행하면될까요?
마지막으로 합쳐서 레이블 인코딩 할때 object 컬럼이 여러개 있다면 (예를들어 6개가 object 컬럼이라면) 6개중 단 하나의 object 컬럼이라도 print(b-a) 했을때 값이 나온다면 합쳐서 레이블 인코딩 후 분리해주는거 맞죠?
답변 1
로지스틱회귀, 회귀
0
13
2
회귀 문제를 풀때 질문입니다.
0
22
1
불균형 처리 후 성능이 더 낮아졌다면,
0
36
2
실기 체험 제2유형 에러 문의
0
30
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
27
2
3번문제 등분산 가정
0
30
2
작업형3 target 형 변환 질문
0
26
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
20
3
원핫인코딩과 레이블 인코딩에서 concat
0
37
2
제2유형 질문입니다.
0
38
2
C()
0
34
2
작업형 2에서 strafity 적용 유무
0
39
2
수강 기간 연장 가능 여부 문의드립니다.
0
42
1
ols
0
34
2
2유형 작성관련 질문(일반 심화)
0
28
2
2유형 작성관련 질문
0
26
2
2유형 object컬럼 개수 다르면
0
34
2
코딩팡질문이요ㅠㅠ
0
35
2
관찰값과 기대값의 개념이 헷갈립니다.
0
18
2
작업형2 ID 컬럼 삭제 질문
0
37
2
2유형 작성관련 질문
0
24
2
memoryerror 질문
0
20
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
35
1
ID 삭제 필수 인가요?
0
32
3





