inflearn logo
강의

講義

知識共有

ビッグデータ/テキストマイニング分析法 (LDA,BERTtopic,感情分析,CONCOR with ChatGPT)

원하는 결과를 얻기 위한 데이터 전처리 관련

230

kjmoon66

投稿した質問数 2

0

안녕하세요

word_count 파일을 가지고 전처리를 하기 위해 유사어나 제외어를 처리를 위해 library파일을 만들었습니다

A 컬럼에는 제외할 키워드를 지정하고 B 칼럼에는 빈 공간을 두었습니다

그리고 유사어 경우 A컬럼에는 '국가' B칼럼에는 '나라' 를 기입했습니다. 그리고 제공해준 대로 코딩을 해서

키워드 빈도나 워드 크라우드를 실행해도 수정되지 않은 결과가 나옵니다(제외할 키워드, 수정할 키워드 반영이 안됨)

왜 그런지 ? 어떤 과정이 문제인지 잘 모르겠습니다

그리고 만약 유사어를 여러개를 지정할 때, 예를 들면 ' 지역주민'과 유사어가 '시민' , '주민' 등과 같이

2개이상일 경우에는 어떻게 작성해야 하는지도 궁금합니다

 

 

빅데이터 텍스트마이닝

回答 1

0

HappyAI

안녕하세요 주어진 코드를 돌리면 정제파일이 생성되는데요 이 새로 생성된 정제파일을 가지고 빈도분석 등 여러 분석을 진행하셨는지요? 기존의 파일로 실행이 됬을 가능성이 높습니다.

시민을 A열에 B열에 지역주민, 주민을 A열에 B열에 지역주민으로 지정하면 됩니다^^

 

심화 강의 개설 여부

0

47

1

48강의 오디오가 나오지 않아요.

0

47

1

혼란도에 대해서 질문드립니다.

0

88

2

구글코랩 실행이 안되서요

0

163

2

질문드립니다.

0

163

2

Ucinet 활용한 CONCOR 데이터 추출이 안 돼요

0

388

3

pyLDAvis 오류

0

207

2

BERTopic에 대해서 질문드립니다.

0

263

2

TF-IDF값에 대해서 질문드립니다.

0

240

3

수업 자료 관련

0

231

3

LDA 분석시 빈출 키워드 관련 질문드립니다.

0

192

1

LDAvis 시각화가 되지 않습니다.

0

335

2

데이터 전처리 관련 질문드립니다.

0

242

1

데이터 전처리시

0

259

2

LDAvis 시각화가 안됩니다.

0

269

2

강의 자료

0

184

1

원하는 결과를 얻기위한 데이터 전처리 기법

0

312

1

LDAvis를 이용한 토픽 모델링 시각화 기법

0

496

1

데이터 전처리2 에서 utf-8 저장 시 한글 깨짐

0

317

1

LDAvis 결과 해석법 with ChatGPT- 강의소리

0

196

1

pyLDAvis시각화

0

382

2

불용어 처리 관련 질문드립니다.

0

314

1

워드 클라우드 cloud=wc.fit_words 코드 에러

0

221

1

형태소 분석 및 워드클라우드 질문드립니다.

0

225

1