inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[3/15] missingno 라이브러리로 결측치 시각화 하기

결측치

211

이현민

작성한 질문수 12

1

이 강의에서는 결측치가 많은 컬럼 제거를 어떻게 하는지 보여주는 거고 실제로는 결측치가 많은 컬럼을 제거 할 때 그 데이터가 필요있는지 없는지 유무를 따지고 그 데이터가 필요없는 것 들 중에서 결측치가 많은 것을 지우는 것을 판단하나요??
무작정 결측치가 많다고 컬럼을 없애면 안되지 않나여

python numpy pandas

답변 1

0

박조은

안녕하세요.

결측치 처리는 다양한 논문 주제로도 쓰이고 있습니다.

질문 주신 것처럼 결측치를 임의로 제거하거나 대체해서는 안 되겠죠.

목적에 따라 결측치를 제거하거나 대체해야 될텐데, 이 때는 다양한 변수와 도메인에 대한 노하우가 필요합니다.

또, 머신러닝, 딥러닝에서도 이런 결측치를 처리하는 여러 방법이 있는데 

어떤 방법이 맞다vs틀리다, 좋다vs나쁘다 보다는 사용하고자 하는 목적과 다른 변수와의 쓰임에 따라 처리해야 합니다.

패키지 설치 에러 ydata-profiling

0

134

2

자세한 설명 부탁드려요 ㅜ

0

200

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

310

2

value_counts와 count 차이

0

376

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

217

3

scatterplot질문

0

132

1

강의 화면이 안나옵니다

0

174

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

193

2

에러 메시지

1

311

2

그래프 색이 동일하게 나옵니다.

0

328

2

시각화 라이브러리 비교

0

400

2

주피터 노트북 설치

0

399

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

233

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

185

1

group by agg function failed 에러

0

696

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

295

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

372

3

get_string함수에서 문자 'nan'

0

205

1

seaborn X축 시작 지점 조정 질의의 건

0

229

1

14강 distplot 질의

0

299

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

487

1

corr = df.corr() 입력시 오류

1

383

1

keyword grid_b is not recognized

0

342

1

%ls data 매직커맨드 사용시 한글 깨짐

0

304

1