인프런 커뮤니티 질문&답변

sun785님의 프로필 이미지
sun785

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리 강의 이상치 처리 질문

해결된 질문

작성

·

224

0

# age가 음수인 데이터
X_train[X_train['age']<=0]
# age가 1이상인 데이터만 살림
print(X_train.shape)
X_train = X_train[X_train['age']>0]
print(X_train.shape)

 

이런식으로 밖에 X_train 대괄호로 전체를 한번 더 묶어주는 것은 어떤 의미가 있나요?

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

입문자들이 어색할 부분입니다.

  1. True / False 결과
    조건 X_train['age']>0 만 작성해서 결과를 출력해보면 각 행별 True / False 결과가 나옵니다.

  2. 필터링

    이를 데이터프레임 X_train[조건]을 넣게 되면 True 행은 반환하고 False인 결과는 반환하지 않아요

만약 대괄호 두개가 헷갈린다면 아래와 같은 코딩 방식을 추천해요

cond = X_train['age']>0
X_train[cond]

 

그리고 판다스 - 필터링 부분 영상을 다시 한번 학습하길 추천드립니다. 화이팅입니다. !!!

sun785님의 프로필 이미지
sun785

작성한 질문수

질문하기