inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Thực chiến]TEXTOM Thực chiến bài giảng: Phân tích văn bản/khai thác văn bản để viết luận văn dữ liệu lớn

25. Phân tích LDA3

25. LDA 분석3 강의에서

461

driedmango365

2 câu hỏi đã được viết

0

Coherence Score가 높을수록, Perplexity score가 낮을수록 좋다고 하셨는데, 왜 토픽수가 2가 아닌 4가 좋다고 하신건가요? Perplexity score는 비슷비슷해보이니까, 확실히 Coherence Score가 높은걸 고르는게 맞지 않나요..?

빅데이터 텍스트마이닝 textom

Câu trả lời 1

0

HappyAI

네 안녕하세요. 좋은 질문 주셔서 감사합니다.

적정 토픽수의 범위가 3이상인데요.

일반적으로 LDA분석을 진행할때 3개 이상의 토픽이 나와야 의미적으로 유의미한 토픽이 나오기 때문입니다.

따라서 3 이상의 토픽을 기준으로 해서 coherence와 perplexity 값을 구합니다.

감사합니다.

기출 11회 작업형 2_전체 데이터 학습 여부

0

11

1

예측값 결과 소수점 차이

0

16

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

13

0

전처리 train() test([ ])

0

14

2

작업형 1 배경지식 질문

0

17

2

옳게 풀은건지 질문드립니다!

0

13

1

roc_auc_score

0

22

2

맥북은 ucinet사용이 제한되나요?

0

550

2

텍스톰으로 Bertopic을 사용할 수는 없나요?

0

284

2

포털과 학술데이터 모두 활용할때

0

211

1

수집키워드 입력

0

311

2

강의가 나오지 않음

0

282

1

유씨넷 프로그램 설치

0

644

2

단어 편집 데이터 업로드 법

1

232

1

복합명사 정제 관련 문의

0

224

1

강의 내용 참고문헌 질문있어요

0

353

2

선생님 질문있어요!

0

422

2

섹션4 연구논문 작성 관련 참고논문 출처

0

275

2

구글학술검색 데이터 관련

0

897

1

데이터 정제 관련

0

365

1

샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니

0

381

3

기 정제한 데이터의 영문 수정 가능 여부

0

308

1

n-gram에 들어갈 단어의 수 선택

0

473

1

분석 키워드 소거에 관하여

0

481

2