inflearn logo
강의

Course

Instructor

Free Python Course (Usage Part 5) - Data Analysis and Visualization

Missing values

결측치 조건 질문있습니다!

275

tg4rgzw7pz6595

1 asked

0

 

자료에서 학교 column을 NaN 으로 바꾼후

'1번' : '6번' row의 '학교'column 의 Nan만 '모름'으로 바꾸고싶어

import pandas as pd
import numpy as np
df = pd.read_csv ( 'score.csv , index_col = '지원번호)
df['학교'] = np.nan
df.loc['1번':'6번' , '학교'].fillna('모름,inplace = True) 

로 해보았는데요 전체 데이터프레임에서 NaN 값이 변화 하질 않네요 이런방식으로 조건걸어 바꾸는건 불가능한가요?

python pandas matplotlib

Answer 1

0

communityai8509

안녕하세요, 우영 최 님. 인프런 AI 인턴이에요.

조건에 맞는 결측치를 변경하고자 한다면, 조건을 제대로 설정하셔야 합니다. 현재 코드에서는 loc을 사용하여 조건을 설정하셨지만, 인덱스 번호를 지원번호로 사용하려면 작은따옴표(')가 빠져있고, 인덱스 슬라이싱 범위를 잘못 지정하셨습니다.

아래 코드와 같이 수정하시면, 원하시는 결과를 얻을 수 있을 것입니다.

import pandas as pd
import numpy as np

df = pd.read_csv('score.csv', index_col='지원번호')
df['학교'] = np.nan
df.loc[df.index.isin(['1번', '2번', '3번', '4번', '5번', '6번']), '학교'] = '모름'

이렇게 하면 ‘1번’부터 ‘6번’까지의 행 중 ‘학교’ 열이 NaN인 값들만 ‘모름’으로 변경될 것입니다. 즉, 원하는 조건으로 결측치를 바꾸실 수 있습니다. 참고로 inplace=True는 원본 데이터프레임을 수정하도록 하는 옵션입니다.

다른 문제가 있으시다면 언제든지 도움을 주세요. 감사합니다!

7회 3유형 2번문제 질문

0

1

0

예시문제 작업형2 (ver2023) 질문입니다

0

6

1

Data type에 따른 처리

0

4

1

Cursor 실행 문의

1

10

2

데이터 전처리 관련

0

9

2

시험에서 문제 불러오기

0

7

2

2번문제 출력값 질문

0

12

2

pd.get_dummies()가 bool로 반환

0

14

2

대응표본검정 레빈

0

17

3

goupby.mean() 오류

1

721

1

IN[ ] 번호 질문

0

195

1

존나 재밌다....형 왜이렇게 강의 잘해? 형 신이야? 사랑해

0

375

1

Group By 후 연산 적용 시 에러 나는 분들 참고하세요.

2

953

1

오류

0

352

1

Capitalization 결과를 원 데이터에 반영시키려면?

0

371

1

에러 설명 좀

0

300

1

특정 컬럼만 가져오는 명령에서 아래와 같은 에러 발생 설명 좀 해주세요

0

299

1

구글 코랩으로 해도 될까요?

0

543

0

filter 역으로 적용

0

250

1

1

0

248

1

인구 피라미드 프로젝트에서...

0

360

0

출산율 수 및 합계 출산율에서 외부 범례 처리

0

292

0

여러 그래프관련 x축 값 rotationa 설정 방법

0

278

0

산점도 그래프 강의중 xlabel, ylabel 관련

0

214

0