n-gram에 들어갈 단어의 수 선택
469
2 asked
n-gram에 들어갈 단어는 그 갯수를 사용자가 결정할 수 있는데, 그 수를 결정하는 데에 어떤 근거가 있을까요? 아니면 그냥 사용자가 의미있어보이는 순위까지만 사용하는건가요?
Answer 1
0
안녕하세요
일단은 N-gram을 도출하는 기준은 빈도수가 높은 기준으로 해서 도출을 하고
상위 몇개까지 도출하는 것을 결정하는 것은
시각화시에는 화면에 잘 나타낼 수 있는 범위로하며
데이터를 표로 나타낼 경우에는
적게는 10위, 많게는 30위까지 나타내는데, 표 데이터에 대한 도출근거는
데이터의 분석 목적에 맞는 주요 N-gram 단어들을 나타낼 수 있는 상위 단어 기준으로 한다고 보시면 될 것 같습니다.
이진규 드림
작업형 1 유형 부분
0
10
1
작업형 1 (삭제예정, 구 버전)
0
30
2
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
24
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
맥북 환경구성 에러
0
19
2
맥북은 ucinet사용이 제한되나요?
0
526
2
텍스톰으로 Bertopic을 사용할 수는 없나요?
0
264
2
포털과 학술데이터 모두 활용할때
0
201
1
수집키워드 입력
0
300
2
강의가 나오지 않음
0
270
1
유씨넷 프로그램 설치
0
634
2
단어 편집 데이터 업로드 법
1
224
1
복합명사 정제 관련 문의
0
218
1
강의 내용 참고문헌 질문있어요
0
335
2
선생님 질문있어요!
0
415
2
섹션4 연구논문 작성 관련 참고논문 출처
0
265
2
구글학술검색 데이터 관련
0
879
1
데이터 정제 관련
0
356
1
샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니
0
371
3
25. LDA 분석3 강의에서
0
455
1
기 정제한 데이터의 영문 수정 가능 여부
0
302
1
분석 키워드 소거에 관하여
0
473
2

