강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của jeongwon
jeongwon

câu hỏi đã được viết

Phân tích văn bản tiếng Hàn và xử lý ngôn ngữ tự nhiên với Python cho mọi người

0201 Áp dụng trọng số thông qua TF-IDF

안녕하세요 선생님

Viết

·

305

·

Đã chỉnh sửa

0

안녕하세요 선생님

대학교에서 캡스톤디자인을 수행하고 있는 학생입니다.

판결문에서 사건의 원인,판결 결과,가중·감소 처벌 요소,키워드를 추출하고 싶은데 어떤 기술을 사용해야할지 막막하여 질문올리게 되었습니다.

거대언어모델은 지양하라고 교수님께서 말씀하셨습니다..ㅜ

조언을 주신다면 감사하겠습니다.

 

python머신러닝빅데이터NLP텍스트마이닝data-clustering데이터-리터러시

Câu trả lời 1

0

todaycode님의 프로필 이미지
todaycode
Người chia sẻ kiến thức

안녕하세요.

텍스트 데이터 전처리(형태소 분석, 불용어 제거 등)를 진행하고

1) 빈도 분석을 해보는게 어떨지 싶습니다.

2) 토픽모델링을 하면 주요 주제별 키워드를 추출합니다.

3) 강의에 있는 텐서플로를 활용한 임베딩을 진행한 후 임베딩 프로젝터로 시각화 해서 가까운 의미의 키워드를 찾아보는 것도 좋겠습니다.

화이팅입니다 :)

Hình ảnh hồ sơ của jeongwon
jeongwon

câu hỏi đã được viết

Đặt câu hỏi