불용어 처리 관련 질문드립니다.

Question

안녕하세요LDA 분석하는 강의에서 데이터의 특수문자나 외자 등 불용어들이 깔끔하게 정리가 안되서 불용어 제거하는 팁을 보여주셨었잖아요.df['title_contents']=df['title_contents'].str.replace(pat='는',repl='')이 과정을 데이터 전처리 단계에서 형태소 추출하는 단계에서도 적용할 수 있는 것 같아서 아래와 같이 해보았는데 에러 메세지가 떠서 .. 어떤 부분이 문제인지 좀 여쭤보고 싶습니다.도움 부탁드립니다. 감사합니다.[사진][사진]

Answer

안녕하세요위에 보시면 df=df['title_contents']로 title_contents의 칼럼 내용을 df로 저장을 한 상태이기 때문에오류가 났습니다.따라서 df['title_contents']=df['title_contents'].str.replace(pat='',repl)를df=df.str.replace(pat='',repl)로 변경해주시면 될것 같습니다. 감사합니다

우아한 북극곰

불용어 처리 관련 질문드립니다.

이 글과 비슷한 Q&A

pyspark 현업에서 로컬 개발 및 운영

빅분기 내용을 들으면서 질문드립니다.

예시문제 작업형 2 질문

섹션3 파일불러오기 오류 해결 방안