온톨로지 구축
27
4 asked
시멘틱 온톨로지 구축을 위해
데이터를 먼저 공부하고있습니다.
RAG는 구축된 데이터가 들어간걸 조회할 때 쓰는거라고 생각하고있습니다.
온톨로지 구축을 위해 원천데이터 자체를 분석해서 도메인 사전을 만들어야한다는것을 알고있는데
이걸 어떤식으로 구조화해서 구축해야하는지가 감이 안옵니다.
정규식으로는 한계가 있을 것 같고
LLM으로 하자니 할루시네이션 등의 문제가 발생할 여지가 있고요
이런 관련된 강의를 진행하시거나,
제가 강사님 3가지 로드맵을 다 구독중인데
3개중 볼만한 강의가 있으면 회차좀 가이드부탁드립니다..
Answer 1
0
안녕하세요, 좋은 질문 감사합니다.
순서를 살짝 바꿔 생각하시면 좋을 것 같습니다. 도메인 사전을 먼저 만들어 온톨로지를 도출하는 게 아니라, 온톨로지(스키마)를 먼저 설계하고 그 안을 데이터에서 추출해 채우는 방식이 적합합니다.
"정규식 vs LLM" 접근도 데이터 성격에 따라 나누고 제약을 거는 하이브리드로 해결합니다.
정형 데이터(CSV): LLM 없이 결정적 매핑 → 할루시네이션 자체가 없음
비정형 텍스트:
LLMGraphTransformer에allowed_nodes,allowed_relationships로 설계한 스키마를 제약으로 걸면, LLM이 스키마 밖을 못 만들어 할루시네이션이 크게 줄어듭니다. (+ few-shot, 사람 검증)
GraphRAG 강의에서는 이 순서로 보시고, 위키독스 책(https://wikidocs.net/319218)도 참고하세요.
섹션 5 - 27강 (온톨로지 설계 / 제약조건) — 구조화의 핵심
섹션 5 - 28강 (LLMGraphTransformer) — LLM 추출 + 할루시네이션 통제
섹션 6 - 37강 (고유명사/카테고리 추출, High Cardinality) — 도메인 사전 고민을 직접 다룸
추가 질문 있으면 편하게 주세요.
감사합니다.
2.3 Agentic RAG 관련 질문이 있습니다.
0
9
1
드랍 테이블로 지운 ordes에 대해서 질문
0
22
1
Google API에 Generative Language API 선택이 없습니다.
0
19
2
Serpapi 툴을 사용하려 하는데 검색이 안됩니다.
0
26
4
뉴스 데이터 전처리 실습 파일 부재
0
66
3
강의 github 어디에 있나요?
0
75
2
graphRAG - Neo4J로 구현하는 지식 그래프 기반 RAG 시스템 (feat. LangChain)
0
140
2
프로젝트 설정 (uv 설치, ..) -> 해당 영상 자료 없음
0
84
1
test.py 파일이 어딨나요?
0
89
2
EasyOcr 관련
0
74
2
neo4j 사용에 질문 드립니다.
0
70
2
fulltext index 생성이 안됩니다
0
59
2
2강 main.py 파일
0
105
3
neo4j 데스크탑 config파일설정변경
0
118
2
Preview KG_P1_02_neo4j_cypher_advanced.md자료
0
64
1
id(actor) 와 관련한 질문입니다
0
56
2
쿼리문 질문 드립니다.
0
102
3
프로젝트 4 법률 실습데이터 존재하지 않음
0
75
2
LangChain 질문
0
80
2
neo4j의 장점
0
128
2
neo4j-nori-analyzer 출처 문의
0
101
2
2강에서 Aura에 파이썬으로 접속 안 됩니다.
0
158
2
AuraDB 연동 안되는 현상 질문
0
166
1
Text2Cypher 기법에서 Llm이 작성하는 cypher 코드의 오타 발생 문제
0
346
2

