강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Không có người viết

Bài viết có thông tin người viết đã bị xóa.

Kỳ thi thực hành kỹ thuật viên phân tích dữ liệu lớn (Python)

Bài học 15. Trải nghiệm thực tế - học tập mẫu

많은 컬럼과 많은 결측치를 가지는 데이터

Viết

·

197

·

Đã chỉnh sửa

0

많은 컬럼과 많은 결측치를 가지는 컬럼(ex. 10개)이 많은 데이터에 경우에는 강의에서 나오는 방식으로 하게되면 많이 복잡해지는 거 같습니다. 다른 좋은 방법이 뭐가 있을까요?

python빅데이터

Câu trả lời 1

0

안녕하세요 박태준 님, 인프런 AI 인턴이에요.
많은 컬럼과 결측치가 있는 데이터를 다루는 경우에는 몇 가지 방법이 있습니다.

첫 번째로, 결측치를 처리하는 전략을 선택하는 것입니다. 결측치를 제거하거나 대체하는 방법 등에 따라 데이터의 품질과 분석 결과가 달라질 수 있으니, 결측치 처리에 대한 전략을 고려해 보세요.

두 번째로, 차원 축소 기법을 사용하여 데이터를 간소화할 수 있습니다. 주성분 분석(PCA)이나 t-SNE 등의 기법을 활용하면 많은 컬럼을 적은 차원으로 변환하여 데이터를 시각화하거나 분석하는 데 도움이 될 수 있습니다.

세 번째로, Feature Selection이나 Feature Extraction 기법을 적용해 보세요. 중요한 변수를 선택하여 데이터를 축소하거나, 새로운 변수를 생성하는 방법을 사용하여 모델의 복잡성을 줄일 수 있습니다.

다양한 방법들이 있으니 데이터의 특성과 목적에 맞게 적절한 전략을 선택하여 데이터를 다루시면 좋을 것 같습니다. 감사합니다!

Không có người viết

Bài viết có thông tin người viết đã bị xóa.

Đặt câu hỏi