inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝

[실습] 데이터 해석법(N-gram,동시출현단어분석)

n-gram에 들어갈 단어의 수 선택

474

driedmango365

작성한 질문수 2

0

n-gram에 들어갈 단어는 그 갯수를 사용자가 결정할 수 있는데, 그 수를 결정하는 데에 어떤 근거가 있을까요? 아니면 그냥 사용자가 의미있어보이는 순위까지만 사용하는건가요?

빅데이터 텍스트마이닝 textom

답변 1

0

HappyAI

안녕하세요

일단은 N-gram을 도출하는 기준은 빈도수가 높은 기준으로 해서 도출을 하고

상위 몇개까지 도출하는 것을 결정하는 것은

시각화시에는 화면에 잘 나타낼 수 있는 범위로하며

데이터를 표로 나타낼 경우에는

적게는 10위, 많게는 30위까지 나타내는데, 표 데이터에 대한 도출근거는

데이터의 분석 목적에 맞는 주요 N-gram 단어들을 나타낼 수 있는 상위 단어 기준으로 한다고 보시면 될 것 같습니다.

이진규 드림

 

 

 

 

 

 

 

 

 

강의 연장 문의

0

9

1

출력값 질문

0

18

2

수업노트가 어디에 있나요?

0

26

1

실기시험 제출관련

0

157

2

6.20 작업형 2 과적합

0

161

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

51

2

로지스틱회귀, 회귀

0

49

2

맥북은 ucinet사용이 제한되나요?

0

552

2

텍스톰으로 Bertopic을 사용할 수는 없나요?

0

286

2

포털과 학술데이터 모두 활용할때

0

214

1

수집키워드 입력

0

311

2

강의가 나오지 않음

0

282

1

유씨넷 프로그램 설치

0

646

2

단어 편집 데이터 업로드 법

1

235

1

복합명사 정제 관련 문의

0

226

1

강의 내용 참고문헌 질문있어요

0

356

2

선생님 질문있어요!

0

424

2

섹션4 연구논문 작성 관련 참고논문 출처

0

277

2

구글학술검색 데이터 관련

0

898

1

데이터 정제 관련

0

367

1

샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니

0

382

3

25. LDA 분석3 강의에서

0

462

1

기 정제한 데이터의 영문 수정 가능 여부

0

309

1

분석 키워드 소거에 관하여

0

483

2