강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

pms32758님의 프로필 이미지
pms32758

작성한 질문수

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

수업 자료 다운 및 신청 방법 (꼭 들어주세요~, 코드자료는 바로 본 챕터에서 다운받으세요!)

고차원 데이터 질문

작성

·

12

0

안녕하세요. 정말 좋은 강의 잘 듣고 있습니다:)

문득, 강의를 듣다가 궁금한 점이 생겨 질문 남깁니다.

현재 실습으로 진행하고 있는 타이타닉 데이터 같은 경우에는 컬럼 값이 많지 않은 데이터로 EDA 분석 후에 feature engineering, 모델링, 예측 순으로 진행하게 되는데 만약 컬럼 값이 수백개 또는 수천개 정도의 고차원 데이터 같은 경우에는 각각의 컬럼과 타겟변수와의 관계, 컬럼과 컬럼과의 연관성 등 EDA를 진행하기에는 어려움이 있지 않을까하는 의문점이 들었습니다.
이런 고차원 데이터의 경우에는 PCA와 같은 차원축소 기법을 먼저 적용하여 컬럼의 수를 줄인 후에 EDA를 진행하는 것이 맞는건지 질문드립니다.

답변

답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!
pms32758님의 프로필 이미지
pms32758

작성한 질문수

질문하기