inflearn logo
강의

Course

Instructor

graphRAG - Knowledge Graph-based RAG System Implemented with Neo4J (feat. LangChain)

온톨로지 구축

27

rabbit125834668

4 asked

0

시멘틱 온톨로지 구축을 위해

데이터를 먼저 공부하고있습니다.

RAG는 구축된 데이터가 들어간걸 조회할 때 쓰는거라고 생각하고있습니다.

온톨로지 구축을 위해 원천데이터 자체를 분석해서 도메인 사전을 만들어야한다는것을 알고있는데

이걸 어떤식으로 구조화해서 구축해야하는지가 감이 안옵니다.

정규식으로는 한계가 있을 것 같고

LLM으로 하자니 할루시네이션 등의 문제가 발생할 여지가 있고요

이런 관련된 강의를 진행하시거나,

제가 강사님 3가지 로드맵을 다 구독중인데

3개중 볼만한 강의가 있으면 회차좀 가이드부탁드립니다..


dbms/rdbms neo4j llm langchain rag

Answer 1

0

pdstudio

안녕하세요, 좋은 질문 감사합니다.

순서를 살짝 바꿔 생각하시면 좋을 것 같습니다. 도메인 사전을 먼저 만들어 온톨로지를 도출하는 게 아니라, 온톨로지(스키마)를 먼저 설계하고 그 안을 데이터에서 추출해 채우는 방식이 적합합니다.

"정규식 vs LLM" 접근도 데이터 성격에 따라 나누고 제약을 거는 하이브리드로 해결합니다.

  • 정형 데이터(CSV): LLM 없이 결정적 매핑 → 할루시네이션 자체가 없음

  • 비정형 텍스트: LLMGraphTransformerallowed_nodes, allowed_relationships로 설계한 스키마를 제약으로 걸면, LLM이 스키마 밖을 못 만들어 할루시네이션이 크게 줄어듭니다. (+ few-shot, 사람 검증)

GraphRAG 강의에서는 이 순서로 보시고, 위키독스 책(https://wikidocs.net/319218)도 참고하세요.

  1. 섹션 5 - 27강 (온톨로지 설계 / 제약조건) — 구조화의 핵심

  2. 섹션 5 - 28강 (LLMGraphTransformer) — LLM 추출 + 할루시네이션 통제

  3. 섹션 6 - 37강 (고유명사/카테고리 추출, High Cardinality) — 도메인 사전 고민을 직접 다룸


추가 질문 있으면 편하게 주세요.

감사합니다.

2.3 Agentic RAG 관련 질문이 있습니다.

0

9

1

드랍 테이블로 지운 ordes에 대해서 질문

0

22

1

Google API에 Generative Language API 선택이 없습니다.

0

19

2

Serpapi 툴을 사용하려 하는데 검색이 안됩니다.

0

26

4

뉴스 데이터 전처리 실습 파일 부재

0

66

3

강의 github 어디에 있나요?

0

75

2

graphRAG - Neo4J로 구현하는 지식 그래프 기반 RAG 시스템 (feat. LangChain)

0

140

2

프로젝트 설정 (uv 설치, ..) -> 해당 영상 자료 없음

0

84

1

test.py 파일이 어딨나요?

0

89

2

EasyOcr 관련

0

74

2

neo4j 사용에 질문 드립니다.

0

70

2

fulltext index 생성이 안됩니다

0

59

2

2강 main.py 파일

0

105

3

neo4j 데스크탑 config파일설정변경

0

118

2

Preview KG_P1_02_neo4j_cypher_advanced.md자료

0

64

1

id(actor) 와 관련한 질문입니다

0

56

2

쿼리문 질문 드립니다.

0

102

3

프로젝트 4 법률 실습데이터 존재하지 않음

0

75

2

LangChain 질문

0

80

2

neo4j의 장점

0

128

2

neo4j-nori-analyzer 출처 문의

0

101

2

2강에서 Aura에 파이썬으로 접속 안 됩니다.

0

158

2

AuraDB 연동 안되는 현상 질문

0

166

1

Text2Cypher 기법에서 Llm이 작성하는 cypher 코드의 오타 발생 문제

0

346

2