온톨로지 구축
11
작성한 질문수 4
시멘틱 온톨로지 구축을 위해
데이터를 먼저 공부하고있습니다.
RAG는 구축된 데이터가 들어간걸 조회할 때 쓰는거라고 생각하고있습니다.
온톨로지 구축을 위해 원천데이터 자체를 분석해서 도메인 사전을 만들어야한다는것을 알고있는데
이걸 어떤식으로 구조화해서 구축해야하는지가 감이 안옵니다.
정규식으로는 한계가 있을 것 같고
LLM으로 하자니 할루시네이션 등의 문제가 발생할 여지가 있고요
이런 관련된 강의를 진행하시거나,
제가 강사님 3가지 로드맵을 다 구독중인데
3개중 볼만한 강의가 있으면 회차좀 가이드부탁드립니다..
답변 1
0
안녕하세요, 좋은 질문 감사합니다.
순서를 살짝 바꿔 생각하시면 좋을 것 같습니다. 도메인 사전을 먼저 만들어 온톨로지를 도출하는 게 아니라, 온톨로지(스키마)를 먼저 설계하고 그 안을 데이터에서 추출해 채우는 방식이 적합합니다.
"정규식 vs LLM" 접근도 데이터 성격에 따라 나누고 제약을 거는 하이브리드로 해결합니다.
정형 데이터(CSV): LLM 없이 결정적 매핑 → 할루시네이션 자체가 없음
비정형 텍스트:
LLMGraphTransformer에allowed_nodes,allowed_relationships로 설계한 스키마를 제약으로 걸면, LLM이 스키마 밖을 못 만들어 할루시네이션이 크게 줄어듭니다. (+ few-shot, 사람 검증)
GraphRAG 강의에서는 이 순서로 보시고, 위키독스 책(https://wikidocs.net/319218)도 참고하세요.
섹션 5 - 27강 (온톨로지 설계 / 제약조건) — 구조화의 핵심
섹션 5 - 28강 (LLMGraphTransformer) — LLM 추출 + 할루시네이션 통제
섹션 6 - 37강 (고유명사/카테고리 추출, High Cardinality) — 도메인 사전 고민을 직접 다룸
추가 질문 있으면 편하게 주세요.
감사합니다.
mysql워크벤치를 실행할때마다 오류가 뜹니다. 해결 방법좀 가르켜주세요.
0
9
0
실제로 작은 기업에서 기획 롤
1
11
1
강의 완료 시점 문의
0
17
1
n8n workflow 작성 시 gemini 연결 문제
0
25
2
뉴스 데이터 전처리 실습 파일 부재
0
63
3
강의 github 어디에 있나요?
0
69
2
graphRAG - Neo4J로 구현하는 지식 그래프 기반 RAG 시스템 (feat. LangChain)
0
134
2
프로젝트 설정 (uv 설치, ..) -> 해당 영상 자료 없음
0
79
1
test.py 파일이 어딨나요?
0
86
2
EasyOcr 관련
0
72
2
neo4j 사용에 질문 드립니다.
0
68
2
fulltext index 생성이 안됩니다
0
59
2
2강 main.py 파일
0
102
3
neo4j 데스크탑 config파일설정변경
0
113
2
Preview KG_P1_02_neo4j_cypher_advanced.md자료
0
63
1
id(actor) 와 관련한 질문입니다
0
54
2
쿼리문 질문 드립니다.
0
98
3
프로젝트 4 법률 실습데이터 존재하지 않음
0
74
2
LangChain 질문
0
79
2
neo4j의 장점
0
126
2
neo4j-nori-analyzer 출처 문의
0
99
2
2강에서 Aura에 파이썬으로 접속 안 됩니다.
0
153
2
AuraDB 연동 안되는 현상 질문
0
164
1
Text2Cypher 기법에서 Llm이 작성하는 cypher 코드의 오타 발생 문제
0
343
2





