해보니 잘 안되서 코드 사진 올려봅니다,, df[[ ~ ]] = df[[ ~ ]].apply(np.log1p) 사진에서 두번째 코드는 이렇게 하여서 로그변화를 시켰습니다, 이렇게 원핫을 시켜 결과를 얻었는데 이렇게 하면 feature importance가 f1, f2처럼 컬럼명으로 나오지 않아서 dataframe으로 바꿔서 해보고싶습니다. 강사님께서 알려주신 방법으로 했는데 잘 안되네요,, 어떻게 get_dummie를 사용해서 dataframe으로 바꿔야할지 잘 모르겟습니다.. 아니면 혹시 f1 f2 가 어떤 변수를 지칭하고 있는지 확인할수 있는 방법이 있을까요??
답변 감사합니다! 계속해서 질문 드려 죄송합니다 ㅠㅠ 이렇게 순서대로 코딩을 했습니다 num_cols과 cat_cols을 나누어서 수치형 변수들은 np.log1p를 주었고 범주형 데이터는 pd.get_dummies(cat_cols)을 사용하여 아래 사진과같이 0 1로 잘 표현이 된것 같습니다. 이전에 OHE를 사용했을 때는 이렇게 X를 지정 했는데 X = hstack((df[num_cols], ohe.fit_transform(df[cat_cols]))) ohe.fit_transform(df[cat_cols]))) 이부분 대신 df[cat_cols]을 했더니 X = hstack((df[num_cols], df[cat_cols])) ValueError: could not broadcast input array from shape (692,11) into shape (692,) 에러가 나옵니다. X에 어떻게 지정해야 할까요??