강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

이시온님의 프로필 이미지
이시온

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

데이터 전처리 - 인코딩 - 02

인코딩 수행 질문드립니다.

작성

·

182

0

descriptor_df.iloc[:, :-4].head()

 

1. 위와 같은 데이터에서 첫 번째 컬럼을 인코딩하려고합니다.

 

smiles = descriptor_df[['SMILES']]

pd.get_dummies(smiles_df)

>>> get_dummies를 이용해서 인코딩을 수행하였습니다.

 

2. PCA 변환을 수행하기위해 정규화를 진행하려고 했지만 인코딩 오류가 발생했습니다.

descriptor_scaled = StandardScaler().fit_transform(descriptor_df.iloc[:, 0:-4])

 

제 생각으로는 인코딩을 수행한 값이 원본 데이터 값에 적용이 안 된것 같은데 혹시 어떻게 수정해야 할지 알 수 있을까요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

아래와 같이 pd.get_dummies() 호출 결과를 반환 받아야 할 것 같습니다만, 

descriptor_df = pd.get_dummies(smiles_df)

한번 적용해 보시고 안되면 다시 말씀해 주십시요. 

이시온님의 프로필 이미지
이시온
질문자

감사합니다 해결했습니다!

이시온님의 프로필 이미지
이시온

작성한 질문수

질문하기