강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

veryycherry님의 프로필 이미지
veryycherry

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[12/21] 정규표현식으로 텍스트 전처리 함수 만들기

get_string 함수

작성

·

349

1

get_string 함수와 관련된 질문이 있습니다.

1. 결측치면 입력값 그대로 출력하도록 하기 위해

def get_string (data) :
    if data == "Nan"
      return data

이런 식으로 코드를 작성하면 왜 안될까요?ㅠㅠ

2. re.sub("[\d\.'\-(nan)\[\]\/]""", text)에서

nan을 왜 ()에 넣어야 하는지 궁금합니다.

답변 1

2

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

1) "Nan" 이라는 문자열과 같은지를 비교하고 있어요. 해당 조건문은 결측치를 보는게 아니라 data라는 변수에 "Nan" 이라는 문자와 같은지를 보는거에요.

pd.isnull(data) 로 비교해 보세요.

2. nan 을 그냥 넣어주면 n, a, n 이라는 문자가 하나라도 포함되는걸 다 찾게 됩니다.

(nan) 으로 묶어주어야 nan 으로 되어 있는 문자를 찾습니다.

veryycherry님의 프로필 이미지
veryycherry
질문자

이해가 잘 되었습니다 감사합니다 

veryycherry님의 프로필 이미지
veryycherry

작성한 질문수

질문하기