인프런 커뮤니티 질문&답변
고차원 데이터 질문
작성
·
12
0
안녕하세요. 정말 좋은 강의 잘 듣고 있습니다:)
문득, 강의를 듣다가 궁금한 점이 생겨 질문 남깁니다.
현재 실습으로 진행하고 있는 타이타닉 데이터 같은 경우에는 컬럼 값이 많지 않은 데이터로 EDA 분석 후에 feature engineering, 모델링, 예측 순으로 진행하게 되는데 만약 컬럼 값이 수백개 또는 수천개 정도의 고차원 데이터 같은 경우에는 각각의 컬럼과 타겟변수와의 관계, 컬럼과 컬럼과의 연관성 등 EDA를 진행하기에는 어려움이 있지 않을까하는 의문점이 들었습니다.
이런 고차원 데이터의 경우에는 PCA와 같은 차원축소 기법을 먼저 적용하여 컬럼의 수를 줄인 후에 EDA를 진행하는 것이 맞는건지 질문드립니다.
답변
답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!





