강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của driedmango3652147
driedmango3652147

câu hỏi đã được viết

[Thực chiến]TEXTOM Thực chiến bài giảng: Phân tích văn bản/khai thác văn bản để viết luận văn dữ liệu lớn

[Thực hành] Phương pháp phân tích dữ liệu (N-gram, Phân tích từ đồng xuất hiện)

n-gram에 들어갈 단어의 수 선택

Viết

·

462

0

n-gram에 들어갈 단어는 그 갯수를 사용자가 결정할 수 있는데, 그 수를 결정하는 데에 어떤 근거가 있을까요? 아니면 그냥 사용자가 의미있어보이는 순위까지만 사용하는건가요?

빅데이터텍스트마이닝textom

Câu trả lời 1

0

HappyAI님의 프로필 이미지
HappyAI
Người chia sẻ kiến thức

안녕하세요

일단은 N-gram을 도출하는 기준은 빈도수가 높은 기준으로 해서 도출을 하고

상위 몇개까지 도출하는 것을 결정하는 것은

시각화시에는 화면에 잘 나타낼 수 있는 범위로하며

데이터를 표로 나타낼 경우에는

적게는 10위, 많게는 30위까지 나타내는데, 표 데이터에 대한 도출근거는

데이터의 분석 목적에 맞는 주요 N-gram 단어들을 나타낼 수 있는 상위 단어 기준으로 한다고 보시면 될 것 같습니다.

이진규 드림

 

 

 

 

 

 

 

 

 

Hình ảnh hồ sơ của driedmango3652147
driedmango3652147

câu hỏi đã được viết

Đặt câu hỏi