• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

불용어 처리 관련 질문드립니다.

24.03.05 10:57 작성 조회수 91

0

안녕하세요

LDA 분석하는 강의에서 데이터의 특수문자나 외자 등 불용어들이 깔끔하게 정리가 안되서 불용어 제거하는 팁을 보여주셨었잖아요.

df['title_contents']=df['title_contents'].str.replace(pat="는",repl="")

이 과정을 데이터 전처리 단계에서 형태소 추출하는 단계에서도 적용할 수 있는 것 같아서 아래와 같이 해보았는데 에러 메세지가 떠서 .. 어떤 부분이 문제인지 좀 여쭤보고 싶습니다.

도움 부탁드립니다. 감사합니다.

error6.pngerror7.png

답변 1

답변을 작성해보세요.

0

안녕하세요

 

위에 보시면 df=df['title_contents']로 title_contents의 칼럼 내용을 df로 저장을 한 상태이기 때문에

오류가 났습니다.

따라서

df['title_contents']=df['title_contents'].str.replace(pat="",repl)를

df=df.str.replace(pat="",repl)로 변경해주시면 될것 같습니다.

 

감사합니다