inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝

복합명사 정제 관련 문의

218

해리

작성한 질문수 2

0

선생님 안녕하세요~ 실습을 해보다 의문점이 생겨 글을 남깁니다.

 

정제과정에서 혹시 두 단어로 만들어진 복합명사, 예를 들어 “국제법” 같은 경우 “국제” 와 ”법“으로 분석이 되는데요. 원글에 국제법으로 표기된 경우 이를 나누지 않고 ”국제법“으로 분석이 되게 할수 있는 방법이 있을까요?

이것저것 해봤는데 적용이 안되어 선생님께 도움을 청합니다!

감사합니다^^

빅데이터 텍스트마이닝 textom

답변 1

0

HappyAI

안녕하세요 질문 주셔서 감사합니다^^

이경우 형태소 분석기에서 복합명사를 인식하지 못하는 경우인데요.

방법은 2가지가 있습니다.

1.데이터 수집 후 데이터 전처리 부분에서 사용자 사전에서 "국제법"을 복합 명사로 처리되도록 등록 하는 방법

2.데이터 정제 과정에서 "국제"->"국제법"으로 변경한 뒤 "법"단어를 삭제하거나 "법"->"국제법"으로 변경한 뒤 "국제"단어를 삭제하는 방법

 

개인적으로 데이터 정제를 하실줄 아시니깐 2번째 방법이 좋으실것 같네요.

 

감사합니다(혹시 시간 되실때 강의 후기도 남겨주시면 제가 큰 힘이 될것 같습니다!)

 

 

 

 

 

 

강사님.. 하단 URL에 있었던 코드들 다운 받거나 공유 부탁 드립니다..

0

4

1

작업형1 강의 수강 완료 후..

0

10

0

작업형1 모의문제 4번에 3)문제 질문

0

16

2

이상치 전처리 작업

0

25

2

평가결과값 문의

0

27

2

하단 파일이 열리지 않습니다

0

34

1

ssh-keygen -t rsa -P "" 등 ssh 암호화? 는 하둡에서 필수인가요?

0

27

2

맥북은 ucinet사용이 제한되나요?

0

531

2

텍스톰으로 Bertopic을 사용할 수는 없나요?

0

266

2

포털과 학술데이터 모두 활용할때

0

204

1

수집키워드 입력

0

302

2

강의가 나오지 않음

0

271

1

유씨넷 프로그램 설치

0

637

2

단어 편집 데이터 업로드 법

1

224

1

강의 내용 참고문헌 질문있어요

0

335

2

선생님 질문있어요!

0

415

2

섹션4 연구논문 작성 관련 참고논문 출처

0

265

2

구글학술검색 데이터 관련

0

884

1

데이터 정제 관련

0

356

1

샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니

0

373

3

25. LDA 분석3 강의에서

0

456

1

기 정제한 데이터의 영문 수정 가능 여부

0

302

1

n-gram에 들어갈 단어의 수 선택

0

470

1

분석 키워드 소거에 관하여

0

475

2