inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

밑바닥 부터 시작하는 머신러닝 입문

20news group classifaication 2

정규표현식 중 이해가 되지 않는 표현이 있습니다.

149

감동기

작성한 질문수 7

0

안녕하세요. 좋은 강의 항상 감사드립니다.

data_cleansing()에서 숫자를 삭제하기 위해서 사용한 r'\b|\d+|\b'이 정확히 어떠한 문자열을 목표로 하고 있는지 잘 모르겠습니다.

'|'는 or이라고 알고 있는데, 그냥 해석하면 word boundry OR digits OR word boundry 인데

or랑 word boundry가 같이 있으니 정확한 의미 파악이 안됩니다.
혹시 r'\b\d+\b'의 오타인가요?

머신러닝 배워볼래요?

답변 1

0

TeamLab

| 는 빼야할 듯 합니다. 숫자만 정확히 제외하고 "A4" 'A6" 같은 단어들은 빼기 위해서 사용했습니다. bd+b 로 표현하는게 맞을거 같습니다.

environment setup - windows 사용자는 어떻게

0

214

0

Chapter 10에 대한 강의안이 없는것 같습니다.

0

287

0

이게 이렇게 어려운 이유가 뭐죠?

0

232

0

Python 코드 실행을 위한 코드 다운로드 관련

0

252

1

matrix product문제 질문 드립니다.

0

222

0

강의자료중 코드는 다운로드 안 되나요?

0

192

0

scikit-learn preprocessing 할때 Data Frame object has no attribute 'as matrix'라는 오류가 뜹니다

0

352

1

pdf 강의자료 다운로드 관련

0

214

1

과제 제출 시 위 에러가 나옵니다. 어떻게 해야 하나요?

0

228

1

Gradient Boosting에서 Light GBM, XGBOOST

0

331

1

np.where 값 리턴

0

305

1

숙제 제출 오류

0

218

1

다른분들이 짠 코드를 볼수있을까요?

0

205

1

house data 전처리 코드 관련 질문

0

684

1

설치이후 Pandas import 문제

0

1629

2

import sklearn import preprocessing 부터 에러가 납니다.

0

389

2

엑셀 파일 생성이 안됩니다.

0

489

2

딥러닝 강좌 관련해서 질문올립니다.

0

214

1

ch11 강의 코드

0

216

0

코드를 볼수 가 없어요

0

272

0

소스코드

0

171

1

질문있습니다

0

149

1

deactivate 가 되지 않는 경우

0

254

1

kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.

0

161

0