강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của pms327583976
pms327583976

câu hỏi đã được viết

[Làm mới] Bootcamp Học máy Python cho người mới bắt đầu (Dễ dàng! Giải quyết bài toán Kaggle thực tế và tổng hợp) [Phân tích/Khoa học Dữ liệu Part2]

Cách tải tài liệu học tập và đăng ký (Vui lòng nhất định xem~, tài liệu code hãy tải ngay tại chương này!)

고차원 데이터 질문

Viết

·

40

0

안녕하세요. 정말 좋은 강의 잘 듣고 있습니다:)

문득, 강의를 듣다가 궁금한 점이 생겨 질문 남깁니다.

현재 실습으로 진행하고 있는 타이타닉 데이터 같은 경우에는 컬럼 값이 많지 않은 데이터로 EDA 분석 후에 feature engineering, 모델링, 예측 순으로 진행하게 되는데 만약 컬럼 값이 수백개 또는 수천개 정도의 고차원 데이터 같은 경우에는 각각의 컬럼과 타겟변수와의 관계, 컬럼과 컬럼과의 연관성 등 EDA를 진행하기에는 어려움이 있지 않을까하는 의문점이 들었습니다.
이런 고차원 데이터의 경우에는 PCA와 같은 차원축소 기법을 먼저 적용하여 컬럼의 수를 줄인 후에 EDA를 진행하는 것이 맞는건지 질문드립니다.

python머신러닝pandaskaggle

Câu trả lời

Câu hỏi này đang chờ câu trả lời
Hãy là người đầu tiên trả lời!
Hình ảnh hồ sơ của pms327583976
pms327583976

câu hỏi đã được viết

Đặt câu hỏi