inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[7/10] 파리바게뜨와 뚜레쥬르 분석을 위한 텍스트 데이터 다루기

선생님 파리바게뜨 브랜드명 만들어줄때

239

freedom07

작성한 질문수 104

1

선생님~

"브랜드명"을 만들어줄 때 처음에 파리바게뜨 먼저 했는데요~

강의(10:17)에서는 
df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨"  이렇게 했는데.. 

df_bread.loc[df_bread["상호명"].str.contains("파리(바게|크라상)"), "브랜드명"] = "파리바게뜨"

이렇게 해야 하지 않나요..?!

"상호명" 컬럼 확인해보면 파리크라상도 있어서요..

강의에서

df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨" 

이렇게 하시고

바로 df_bread["브랜드명"] = df_bread["브랜드명"].fillna("뚜레쥬르") 이렇게 하게되면..

'파리크라상'인 "상호명"들도 '뚜레쥬르'로 되지 않나요..?

numpy python pandas

답변 3

0

freedom07

아 그렇군요 ㅎ 네  감사합니다^^

0

박조은

이 부분에 대해 input 실습파일에도 해당 내용을 추가반영했습니다.

좋은 질문 감사합니다!

0

박조은

안녕하세요.

질문 주신 내용이 맞아요.  output 파일에는 해당 내용을 업데이트 해두었는데 영상은 다음 업데이트에 반영할 예정입니다.

output 파일에서는  아래와 같이 전처리를 해요.

# 브랜드명 컬럼을 만듭니다. "파리바게뜨" 에 해당되는 데이터에 대한 값을 채워줍니다.

df_bread.loc[df_bread["상호명"].str.contains("파리바게"), "브랜드명"] = "파리바게뜨"

df_bread.loc[df_bread["상호명"].str.contains("파리크라상"), "브랜드명"] = "파리바게뜨"

df_bread.loc[df_bread["상호명"].str.contains("뚜레"), "브랜드명"] = "뚜레쥬르"

df_bread[["상호명", "브랜드명"]].head()

혼란을 드려 죄송합니다.

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

341

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

212

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

477

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

292

1