inflearn logo
강의

Course

Instructor

[Practical] TEXTOM Practical Lecture: Text Analysis/Text Mining for Big Data Thesis Writing

복합명사 정제 관련 문의

218

hrjoo10309599

2 asked

0

선생님 안녕하세요~ 실습을 해보다 의문점이 생겨 글을 남깁니다.

 

정제과정에서 혹시 두 단어로 만들어진 복합명사, 예를 들어 “국제법” 같은 경우 “국제” 와 ”법“으로 분석이 되는데요. 원글에 국제법으로 표기된 경우 이를 나누지 않고 ”국제법“으로 분석이 되게 할수 있는 방법이 있을까요?

이것저것 해봤는데 적용이 안되어 선생님께 도움을 청합니다!

감사합니다^^

빅데이터 텍스트마이닝 textom

Answer 1

0

HappyAI

안녕하세요 질문 주셔서 감사합니다^^

이경우 형태소 분석기에서 복합명사를 인식하지 못하는 경우인데요.

방법은 2가지가 있습니다.

1.데이터 수집 후 데이터 전처리 부분에서 사용자 사전에서 "국제법"을 복합 명사로 처리되도록 등록 하는 방법

2.데이터 정제 과정에서 "국제"->"국제법"으로 변경한 뒤 "법"단어를 삭제하거나 "법"->"국제법"으로 변경한 뒤 "국제"단어를 삭제하는 방법

 

개인적으로 데이터 정제를 하실줄 아시니깐 2번째 방법이 좋으실것 같네요.

 

감사합니다(혹시 시간 되실때 강의 후기도 남겨주시면 제가 큰 힘이 될것 같습니다!)

 

 

 

 

 

 

작업형 1 유형 부분

0

9

1

작업형 1 (삭제예정, 구 버전)

0

29

2

수강기간 연장 문의드립니다.

0

21

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

23

3

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

27

2

맥북 환경구성 에러

0

19

2

맥북은 ucinet사용이 제한되나요?

0

526

2

텍스톰으로 Bertopic을 사용할 수는 없나요?

0

264

2

포털과 학술데이터 모두 활용할때

0

201

1

수집키워드 입력

0

300

2

강의가 나오지 않음

0

270

1

유씨넷 프로그램 설치

0

634

2

단어 편집 데이터 업로드 법

1

224

1

강의 내용 참고문헌 질문있어요

0

335

2

선생님 질문있어요!

0

415

2

섹션4 연구논문 작성 관련 참고논문 출처

0

265

2

구글학술검색 데이터 관련

0

879

1

데이터 정제 관련

0

356

1

샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니

0

371

3

25. LDA 분석3 강의에서

0

455

1

기 정제한 데이터의 영문 수정 가능 여부

0

302

1

n-gram에 들어갈 단어의 수 선택

0

469

1

분석 키워드 소거에 관하여

0

473

2