강의

멘토링

커뮤니티

Inflearn コミュニティ Q&A

pms327583976 のプロフィール画像
pms327583976

投稿した質問数

[リニューアル] 初めてのPythonマシンラーニングブートキャンプ (簡単に!実際のKaggle問題を解きながら整理) [データ分析/科学 Part2]

授業資料のダウンロードと申請方法(必ず聞いてください〜、コード資料はこのチャプターからすぐにダウンロードしてください!)

고차원 데이터 질문

作成

·

39

0

안녕하세요. 정말 좋은 강의 잘 듣고 있습니다:)

문득, 강의를 듣다가 궁금한 점이 생겨 질문 남깁니다.

현재 실습으로 진행하고 있는 타이타닉 데이터 같은 경우에는 컬럼 값이 많지 않은 데이터로 EDA 분석 후에 feature engineering, 모델링, 예측 순으로 진행하게 되는데 만약 컬럼 값이 수백개 또는 수천개 정도의 고차원 데이터 같은 경우에는 각각의 컬럼과 타겟변수와의 관계, 컬럼과 컬럼과의 연관성 등 EDA를 진행하기에는 어려움이 있지 않을까하는 의문점이 들었습니다.
이런 고차원 데이터의 경우에는 PCA와 같은 차원축소 기법을 먼저 적용하여 컬럼의 수를 줄인 후에 EDA를 진행하는 것이 맞는건지 질문드립니다.

python머신러닝pandaskaggle

回答

回答を待っている質問です
最初の回答を残してください!
pms327583976 のプロフィール画像
pms327583976

投稿した質問数

質問する