강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

veryycherry님의 프로필 이미지
veryycherry

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[12/21] 정규표현식으로 텍스트 전처리 함수 만들기

get_string 함수

작성

·

356

1

get_string 함수와 관련된 질문이 있습니다.

1. 결측치면 입력값 그대로 출력하도록 하기 위해

def get_string (data) :
    if data == "Nan"
      return data

이런 식으로 코드를 작성하면 왜 안될까요?ㅠㅠ

2. re.sub("[\d\.'\-(nan)\[\]\/]""", text)에서

nan을 왜 ()에 넣어야 하는지 궁금합니다.

퀴즈

57%나 틀려요. 한번 도전해보세요!

데이터 분석 과정에서 데이터 전처리가 중요한 주된 이유는 무엇일까요?

데이터 분석가의 시간을 절약해 줍니다.

정확하고 의미 있는 분석 결과를 얻기 위한 필수 과정입니다.

고급 시각화 기법을 적용할 수 있게 합니다.

데이터 용량을 줄여 저장 공간을 효율적으로 사용합니다.

답변 1

2

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요.

1) "Nan" 이라는 문자열과 같은지를 비교하고 있어요. 해당 조건문은 결측치를 보는게 아니라 data라는 변수에 "Nan" 이라는 문자와 같은지를 보는거에요.

pd.isnull(data) 로 비교해 보세요.

2. nan 을 그냥 넣어주면 n, a, n 이라는 문자가 하나라도 포함되는걸 다 찾게 됩니다.

(nan) 으로 묶어주어야 nan 으로 되어 있는 문자를 찾습니다.

veryycherry님의 프로필 이미지
veryycherry
질문자

이해가 잘 되었습니다 감사합니다 

veryycherry님의 프로필 이미지
veryycherry

작성한 질문수

질문하기