인프런 커뮤니티 질문&답변
hstack 함수를 사용하는 곳에 질문 드립니다.(강의 시간 6:34 부터 약 1분간)
작성
·
377
0
해당 코드에서 X_features_sparse=hstack(sparse_matrix_list).tocsr() 라는 줄로 모든 데이터를 수평방향으로 합친다고 하셨습니다.
그리고 del X_features_sparse로 지우셨습니다.
X_features_sparse를 만들었다가 지운다면, 데이터를 합친 의미가 없는것 같은데... 단순히 데이터 전체의 shape를 보기 위함이었던 건가요?
그리고 데이터의 shape를 본 이유는 어떤것인가요?
강의 너무 잘 듣고 있습니다. 감사합니다 선생님!
퀴즈
56%나 틀려요. 한번 도전해보세요!
텍스트 분석은 비정형 텍스트 데이터에서 모델을 만들고 인사이트를 얻는 데 중점을 둡니다. 그럼 자연어 처리(NLP)의 주요 목표는 무엇일까요?
대규모 데이터베이스를 구축하는 것
인간의 언어를 컴퓨터가 이해하고 해석하는 것
이미지 데이터를 분석하여 패턴을 찾는 것
수치형 데이터의 통계적 특성을 파악하는 것
답변 1
0
권 철민
지식공유자
안녕하십니까,
해당 코드는 sparse matrix의 hstack() 함수가 어떻게 동작하는 것인지 보여 드리기 위해서 샘플용으로 작성한 것입니다.
나중에 학습용 데이터를 생성하고, 모델을 학습/예측하는 로직을 가지는 model_train_predict() 함수에서 이 hstack()함수를 이용하여 학습 데이터를 만들게 됩니다.
그래서 hstack()으로 각 sparse matrix들을 합치고, 이렇게 합쳐진 결과가 어떤 matrix로 만들어지는지 보여 드리기 위해서 shape를 본것입니다.
감사합니다.





