dropna와 drop의 차이가 궁금합니다.
#특정컬럼에 결측치가 있으면 데이터(행) 삭제 subset=['native.country']df = X_train.dropna(subset=['native.country']) # 결측치가 많은 특정 컬럼 삭제 drop(['workclass'], axis=1) df=X_train.drop(['workclass'], axis=1) 언제 drop을 쓰고, 언제 dropna를 쓰는지 궁금합니다.
답변 1
5
drop과 dropna 함수는 모두 pandas 라이브러리에서 데이터프레임을 다룰 때 사용되는 함수입니다. 두 함수의 용도와 사용 시나리오는 다음과 같습니다:
1. `dropna` 함수:
데이터프레임에서 결측치가 포함된 행이나 열을 제거하는 데 사용됩니다.
- df.dropna(): 기본적으로 어떤 행에든 하나 이상의 결측치가 있으면 해당 행을 제거
- df.dropna(axis=1): 어떤 열에든 하나 이상의 결측치가 있으면 해당 열을 제거
- df.dropna(subset=['컬럼명']): 특정 열(여기서는 '컬럼명')에 결측치가 있는 행만 제거
2. `drop` 함수:
특정 행이나 열을 데이터프레임에서 제거하는 데 사용됩니다. 이 함수는 결측치 여부와 무관하게 지정된 행이나 열을 삭제합니다.
- df.drop(['컬럼명'], axis=1): 지정된 열(여기서는 '컬럼명')을 제거
- df.drop([index], axis=0): 지정된 행(여기서는 'index')을 제거
dropna는 결측치를 기준으로 행이나 열을 제거하는 데 사용되며, drop은 특정 행이나 열을 명시적으로 지정하여 제거하는 데 사용됩니다. 결측치 처리에 집중할 때는 dropna를 사용하고, 데이터의 구조를 조정하거나 불필요한 부분을 제거할 때는 drop을 사용합니다.
작업형2 모의문제1 (30강)
0
18
1
수강 기간 연장 문의 드립니다.
0
21
1
수강 계획과 관련해 문의 드립니다.
0
19
1
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
45
2
작업형 1 -연습문제 4-6
0
33
2
작업형 1 유형 부분
0
40
2
작업형 1 (삭제예정, 구 버전)
0
50
2
수강기간 연장 문의드립니다.
0
35
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
36
3
수강기간 연장 문의드립니다.
0
38
1
인덱스 슬라이싱
0
35
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
47
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
62
2
강의 기간 연장 가능여부 검토 요청건
0
50
2
수강기간 연장 문의 드립니다
0
45
2
수강기간 연장 문의드립니다
0
52
2
질문이요
0
57
2
수강기간 연장 문의드립니다.
0
60
2
문제 3-2 질문드립니다
0
47
2





