복합명사 정제 관련 문의
218
投稿した質問数 2
선생님 안녕하세요~ 실습을 해보다 의문점이 생겨 글을 남깁니다.
정제과정에서 혹시 두 단어로 만들어진 복합명사, 예를 들어 “국제법” 같은 경우 “국제” 와 ”법“으로 분석이 되는데요. 원글에 국제법으로 표기된 경우 이를 나누지 않고 ”국제법“으로 분석이 되게 할수 있는 방법이 있을까요?
이것저것 해봤는데 적용이 안되어 선생님께 도움을 청합니다!
감사합니다^^
回答 1
0
안녕하세요 질문 주셔서 감사합니다^^
이경우 형태소 분석기에서 복합명사를 인식하지 못하는 경우인데요.
방법은 2가지가 있습니다.
1.데이터 수집 후 데이터 전처리 부분에서 사용자 사전에서 "국제법"을 복합 명사로 처리되도록 등록 하는 방법
2.데이터 정제 과정에서 "국제"->"국제법"으로 변경한 뒤 "법"단어를 삭제하거나 "법"->"국제법"으로 변경한 뒤 "국제"단어를 삭제하는 방법
개인적으로 데이터 정제를 하실줄 아시니깐 2번째 방법이 좋으실것 같네요.
감사합니다(혹시 시간 되실때 강의 후기도 남겨주시면 제가 큰 힘이 될것 같습니다!)
작업형 1 유형 부분
0
11
1
작업형 1 (삭제예정, 구 버전)
0
31
2
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
24
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
맥북 환경구성 에러
0
19
2
맥북은 ucinet사용이 제한되나요?
0
526
2
텍스톰으로 Bertopic을 사용할 수는 없나요?
0
264
2
포털과 학술데이터 모두 활용할때
0
201
1
수집키워드 입력
0
300
2
강의가 나오지 않음
0
271
1
유씨넷 프로그램 설치
0
634
2
단어 편집 데이터 업로드 법
1
224
1
강의 내용 참고문헌 질문있어요
0
335
2
선생님 질문있어요!
0
415
2
섹션4 연구논문 작성 관련 참고논문 출처
0
265
2
구글학술검색 데이터 관련
0
879
1
데이터 정제 관련
0
356
1
샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니
0
371
3
25. LDA 분석3 강의에서
0
455
1
기 정제한 데이터의 영문 수정 가능 여부
0
302
1
n-gram에 들어갈 단어의 수 선택
0
469
1
분석 키워드 소거에 관하여
0
473
2

