inflearn logo
강의

Course

Instructor

[Renewed] Python Machine Learning Bootcamp for Beginners (Easy! Learn by Solving Real Kaggle Problems) [Data Analysis/Science Part2]

How to download class materials and register (Please make sure to listen~, download code materials directly from this chapter!)

고차원 데이터 질문

49

pms32758

1 asked

0

안녕하세요. 정말 좋은 강의 잘 듣고 있습니다:)

문득, 강의를 듣다가 궁금한 점이 생겨 질문 남깁니다.

현재 실습으로 진행하고 있는 타이타닉 데이터 같은 경우에는 컬럼 값이 많지 않은 데이터로 EDA 분석 후에 feature engineering, 모델링, 예측 순으로 진행하게 되는데 만약 컬럼 값이 수백개 또는 수천개 정도의 고차원 데이터 같은 경우에는 각각의 컬럼과 타겟변수와의 관계, 컬럼과 컬럼과의 연관성 등 EDA를 진행하기에는 어려움이 있지 않을까하는 의문점이 들었습니다.
이런 고차원 데이터의 경우에는 PCA와 같은 차원축소 기법을 먼저 적용하여 컬럼의 수를 줄인 후에 EDA를 진행하는 것이 맞는건지 질문드립니다.

python 머신러닝 pandas kaggle

Answer 0

자료 공유 질문

0

55

1

Ascii 에러 관련하여 질문드립니다

0

77

1

test / train 데이터 나누기

0

96

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

198

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

212

1

sklearn v1.5.1

0

167

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

175

2

missingno 대체

0

165

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

129

1

환불문의

0

263

1

자료공유를 받으려고 하는데 에러가 납니다.

0

157

1

iplot에서 항상 에러나는 분 안계신가용?

0

221

1

사망 여부 영향 가능성

0

140

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

186

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

277

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

243

1

3강 강의 자료 코드 관련 질문입니다

1

336

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

413

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

874

2

Bayesian Optimization LightGBM 적용

0

454

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

340

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

214

1

강의 중 에러 질문

0

738

1

cross_val_score 에러

0

459

1