정규표현식 중 이해가 되지 않는 표현이 있습니다.

18.04.28 14:02 작성 조회수 74

0

안녕하세요. 좋은 강의 항상 감사드립니다.

data_cleansing()에서 숫자를 삭제하기 위해서 사용한 r'\b|\d+|\b'이 정확히 어떠한 문자열을 목표로 하고 있는지 잘 모르겠습니다.

'|'는 or이라고 알고 있는데, 그냥 해석하면 word boundry OR digits OR word boundry 인데

or랑 word boundry가 같이 있으니 정확한 의미 파악이 안됩니다.
혹시 r'\b\d+\b'의 오타인가요?

답변 1

답변을 작성해보세요.

0

| 는 빼야할 듯 합니다. 숫자만 정확히 제외하고 "A4" 'A6" 같은 단어들은 빼기 위해서 사용했습니다. bd+b 로 표현하는게 맞을거 같습니다.