inflearn logo
강의

講義

知識共有

graphRAG - Neo4Jで実装する知識グラフベースのRAGシステム (feat. LangChain)

온톨로지 구축

12

rabbit125834668

投稿した質問数 4

0

시멘틱 온톨로지 구축을 위해

데이터를 먼저 공부하고있습니다.

RAG는 구축된 데이터가 들어간걸 조회할 때 쓰는거라고 생각하고있습니다.

온톨로지 구축을 위해 원천데이터 자체를 분석해서 도메인 사전을 만들어야한다는것을 알고있는데

이걸 어떤식으로 구조화해서 구축해야하는지가 감이 안옵니다.

정규식으로는 한계가 있을 것 같고

LLM으로 하자니 할루시네이션 등의 문제가 발생할 여지가 있고요

이런 관련된 강의를 진행하시거나,

제가 강사님 3가지 로드맵을 다 구독중인데

3개중 볼만한 강의가 있으면 회차좀 가이드부탁드립니다..


dbms/rdbms neo4j llm langchain rag

回答 1

0

pdstudio

안녕하세요, 좋은 질문 감사합니다.

순서를 살짝 바꿔 생각하시면 좋을 것 같습니다. 도메인 사전을 먼저 만들어 온톨로지를 도출하는 게 아니라, 온톨로지(스키마)를 먼저 설계하고 그 안을 데이터에서 추출해 채우는 방식이 적합합니다.

"정규식 vs LLM" 접근도 데이터 성격에 따라 나누고 제약을 거는 하이브리드로 해결합니다.

  • 정형 데이터(CSV): LLM 없이 결정적 매핑 → 할루시네이션 자체가 없음

  • 비정형 텍스트: LLMGraphTransformerallowed_nodes, allowed_relationships로 설계한 스키마를 제약으로 걸면, LLM이 스키마 밖을 못 만들어 할루시네이션이 크게 줄어듭니다. (+ few-shot, 사람 검증)

GraphRAG 강의에서는 이 순서로 보시고, 위키독스 책(https://wikidocs.net/319218)도 참고하세요.

  1. 섹션 5 - 27강 (온톨로지 설계 / 제약조건) — 구조화의 핵심

  2. 섹션 5 - 28강 (LLMGraphTransformer) — LLM 추출 + 할루시네이션 통제

  3. 섹션 6 - 37강 (고유명사/카테고리 추출, High Cardinality) — 도메인 사전 고민을 직접 다룸


추가 질문 있으면 편하게 주세요.

감사합니다.

mysql워크벤치를 실행할때마다 오류가 뜹니다. 해결 방법좀 가르켜주세요.

0

9

0

실제로 작은 기업에서 기획 롤

1

11

1

강의 완료 시점 문의

0

17

1

n8n workflow 작성 시 gemini 연결 문제

0

26

2

뉴스 데이터 전처리 실습 파일 부재

0

63

3

강의 github 어디에 있나요?

0

69

2

graphRAG - Neo4J로 구현하는 지식 그래프 기반 RAG 시스템 (feat. LangChain)

0

134

2

프로젝트 설정 (uv 설치, ..) -> 해당 영상 자료 없음

0

79

1

test.py 파일이 어딨나요?

0

86

2

EasyOcr 관련

0

72

2

neo4j 사용에 질문 드립니다.

0

68

2

fulltext index 생성이 안됩니다

0

59

2

2강 main.py 파일

0

102

3

neo4j 데스크탑 config파일설정변경

0

113

2

Preview KG_P1_02_neo4j_cypher_advanced.md자료

0

63

1

id(actor) 와 관련한 질문입니다

0

54

2

쿼리문 질문 드립니다.

0

98

3

프로젝트 4 법률 실습데이터 존재하지 않음

0

74

2

LangChain 질문

0

79

2

neo4j의 장점

0

126

2

neo4j-nori-analyzer 출처 문의

0

99

2

2강에서 Aura에 파이썬으로 접속 안 됩니다.

0

153

2

AuraDB 연동 안되는 현상 질문

0

164

1

Text2Cypher 기법에서 Llm이 작성하는 cypher 코드의 오타 발생 문제

0

343

2