많은 컬럼과 많은 결측치를 가지는 데이터
201
작성자 없음
0 asked
많은 컬럼과 많은 결측치를 가지는 컬럼(ex. 10개)이 많은 데이터에 경우에는 강의에서 나오는 방식으로 하게되면 많이 복잡해지는 거 같습니다. 다른 좋은 방법이 뭐가 있을까요?
Answer 1
0
안녕하세요 박태준 님, 인프런 AI 인턴이에요.
많은 컬럼과 결측치가 있는 데이터를 다루는 경우에는 몇 가지 방법이 있습니다.
첫 번째로, 결측치를 처리하는 전략을 선택하는 것입니다. 결측치를 제거하거나 대체하는 방법 등에 따라 데이터의 품질과 분석 결과가 달라질 수 있으니, 결측치 처리에 대한 전략을 고려해 보세요.
두 번째로, 차원 축소 기법을 사용하여 데이터를 간소화할 수 있습니다. 주성분 분석(PCA)이나 t-SNE 등의 기법을 활용하면 많은 컬럼을 적은 차원으로 변환하여 데이터를 시각화하거나 분석하는 데 도움이 될 수 있습니다.
세 번째로, Feature Selection이나 Feature Extraction 기법을 적용해 보세요. 중요한 변수를 선택하여 데이터를 축소하거나, 새로운 변수를 생성하는 방법을 사용하여 모델의 복잡성을 줄일 수 있습니다.
다양한 방법들이 있으니 데이터의 특성과 목적에 맞게 적절한 전략을 선택하여 데이터를 다루시면 좋을 것 같습니다. 감사합니다!
구름IDE 서비스 종료 이후 학습환경
0
122
1
10강 연습문제
0
166
1
VotingClassifier Hard 사용
0
111
1
구름IDE 실행 도움 요청
0
162
1
질문입니다 RandomForestClassifier
0
170
1
질문!
0
340
1
데이터 더미화 에러발생 질문.
0
317
1
Dataset은 어디서 받을 수 있나요?
0
395
1
mpg 데이터셋 위치
0
339
1
교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요?
0
376
1
단순평균(1집단)T-test 1번 풀이
0
480
2
강의자료 문의
1
549
1
구름IDE 실행불가문제 ㅠㅠ
0
808
2
제7강 작업유형2-데이터 전처리: LabelEncoder 문법
0
443
1
5강 작업유형1-문제 2 질문입니다
0
407
1
7강 코드 질문드립니다
0
414
1
14강 실전 문제 카테고리 항목문의
0
397
1
작업2유형 문의
0
464
1
데이터셋 분리와 관련하여 질문이 있습니다.
0
446
1
5강의 작업형1-2문제 오류
0
460
1
구름 IDE
0
712
2
[공지] 데이터 전처리 관련 오류 수정
4
546
1
라벨인코더 관련 문의드립니다!
0
506
2
분류 예측에서 결과값의 구체적 내용을 확인할수 있는지요?
0
401
2

