해결된 질문
작성
·
108
0
import pandas as pd
train = pd.read_csv("5_train.csv")
test = pd.read_csv("5_test.csv")
#EDA
train.head()
train.shape, test.shape
# train.info()
# train['price'].value_counts()
train.isnull().sum()
test.isnull().sum()
cols = train.select_dtypes(include='O').columns
print(train.shape, test.shape)
# #Label Encoding
from sklearn.preprocessing import LabelEncoder
for col in cols:
le = LabelEncoder()
train[col] = le.fit_transform(train[col])
test[col] = le.transform(test[col])
print(train.shape, test.shape)
안녕하세요 선생님!
에러는 안 나는데 레이블인코딩이 안되는데 뭐가 문제인지 모르겠습니다..!
답변 1
0
에러도 복사-붙여넣기 부탁드려요!
코드상에 큰 문제 없는 것으로 보아. 다시 한번 실행해주시고
train
과 test
데이터셋의 범주형 컬럼의 고유값을 출력해서 비교해 보시죠!
차이가 있을 수 있습니다.
올려주신 기출문제(다중분류) 4회를 푸는데 에러는 전혀 안 뜨는데 레이블 인코딩만 안되어서요!ㅠㅠ
어쨌든 신택스 문제는 아니라는 말씀이시죠?ㅠㅠ