강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

엠엠님의 프로필 이미지
엠엠

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

실전 텍스트 분석: 04 - Mercari Price Suggestion 피처 인코딩과 피처 벡터화 수행

hstack 함수를 사용하는 곳에 질문 드립니다.(강의 시간 6:34 부터 약 1분간)

작성

·

374

0

해당 코드에서 X_features_sparse=hstack(sparse_matrix_list).tocsr() 라는 줄로 모든 데이터를 수평방향으로 합친다고 하셨습니다.

그리고 del X_features_sparse로 지우셨습니다.

X_features_sparse를 만들었다가 지운다면, 데이터를 합친 의미가 없는것 같은데... 단순히 데이터 전체의 shape를 보기 위함이었던 건가요?

그리고 데이터의 shape를 본 이유는 어떤것인가요?

강의 너무 잘 듣고 있습니다. 감사합니다 선생님!

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

해당 코드는 sparse matrix의 hstack() 함수가 어떻게 동작하는 것인지 보여 드리기 위해서 샘플용으로 작성한 것입니다.

나중에 학습용 데이터를 생성하고, 모델을 학습/예측하는 로직을 가지는 model_train_predict() 함수에서 이 hstack()함수를 이용하여 학습 데이터를 만들게 됩니다.

그래서 hstack()으로 각 sparse matrix들을 합치고, 이렇게 합쳐진 결과가 어떤 matrix로 만들어지는지 보여 드리기 위해서 shape를 본것입니다.

감사합니다.

엠엠님의 프로필 이미지
엠엠

작성한 질문수

질문하기