강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

kjjaws님의 프로필 이미지
kjjaws

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런으로 수행하는 타이타닉 생존자 예측 - 02

titanic 생존자 예측 중 에러

작성

·

279

0

타이타닉 생존자 예측 부분 레이블 인코딩 부분에서 에러가 발생하는데 코드는 똑같은거 같은데 이유를 잘 모르겠습니다..

from sklearn import preprocessing

def encode_features(dataDF):
    features = ['Cabin', 'Sex', 'Embarked']
    for feature in features:
        le = preprocessing.LabelEncoder()
        le = le.fit(dataDF[feature])
        dataDF[feature] = le.transform(dataDF[feature])
    
    return dataDF

titanic_df = encode_features(titanic_df)
titanic_df.head()

답변 2

2

features 선언 다음에 

df['Cabin'] = df['Cabin'].str[:1] 

를 추가 하시면 될 것 같아요

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

용이님, 답변 감사합니다.

뭔가 앞에 실습 코드에서 수행이 빠진것 같습니다.

처음 부터 titanic dataset를 다시 로드해서 해보시거나, 아님 아래 코드를 적용해 보십시요.

from sklearn import preprocessing

titanic_df = pd.read_csv('./titanic_train.csv')
titanic_df['Embarked'].fillna('N',inplace=True)
titanic_df['Cabin'].fillna('N',inplace=True)
titanic_df['Cabin'] = titanic_df['Cabin'].str[:1]

def encode_features(dataDF):
    features = ['Cabin', 'Sex', 'Embarked']
    for feature in features:
        le = preprocessing.LabelEncoder()
        le = le.fit(dataDF[feature])
        dataDF[feature] = le.transform(dataDF[feature])
        
    return dataDF

titanic_df = encode_features(titanic_df)
titanic_df.head()

kjjaws님의 프로필 이미지
kjjaws

작성한 질문수

질문하기