강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

이승현님의 프로필 이미지
이승현

작성한 질문수

코딩 없이 AI 자동화 전문가가 되는 법, n8n 완벽 가이드

N8N으로 구현하는 나만의 RAG 시스템: 벡터 검색부터 AI 응답까지

텍스트 자료를 구글드라이브에서 가져오지 않고 n8n으로 바로 업로드 해서 활용하는 방법은 없을까요?

해결된 질문

작성

·

92

0

열정적인 강의 감사드립니다.

 

[N8N으로 구현하는 나만의 RAG 시스템: 벡터 검색부터 AI 응답까지] 강좌에서

pdf 같은 텍스트 자료를 구글드라이브에서 가져오지 않고 n8n으로 바로 업로드 해서 활용하는 방법은 없을까요?

 

railway에서 n8n을 호스트하다보니 Extract from File 노드에서 DOMMatrix is not defined 에러가 나와서요.

에러에 대해 찾아보니...

다음과 같은 DOMMatrix는 웹 브라우저 환경에 기본적으로 내장된 그래픽 관련 API입니다. 웹페이지에서 2D 및 3D 그래픽 변환을 처리하는 데 사용됩니다.

  • pdf-parse 라이브러리의 특정 버전은 PDF 내부의 그래픽 요소를 처리하기 위해 브라우저에만 존재하는 이 DOMMatrix를 사용하려고 합니다.

  • 하지만 n8n 워크플로우는 서버(Node.js) 환경에서 실행됩니다. 서버 환경에는 그래픽을 렌더링할 화면이 없으므로, 당연히 DOMMatrix와 같은 브라우저 전용 API가 존재하지 않습니다 (is not defined).)

라고 나와서 Extract from File 노드가 서버환경에서는 제대로 작동을 하지 않는 것 같습니다.

 

개인컴에 설치한 것과 환경이 달라서 종종 애를 먹고 있습니다. 제 컴이 old 해서 n8n을 돌리기에는 GPU가 역부족이라서요...ㅜㅜ

답변 1

0

남박사님의 프로필 이미지
남박사
지식공유자

일단 조금 의아한 부분이 있긴합니다. 어떤 환경에서 사용중이신지 모르겠습니다만 서버에서 동작 중이던 내 컴퓨터에서 동작 중이던 결국 도커 기반으로 구동되는 거라면 그게 호스팅이던 내 컴퓨터던 사실 상관이 없어야 할텐데요? 물론 도커를 직접 셋팅해서 사용하는게 아니라 특정 호스팅 업체가 n8n만 서빙해서 제공하는 서비스라면 물론 환경이 다르긴 합니다만, 이 경우가 아니라 직접 self 킷을 도커 명령어로 설치한 상황이라면 도커 자체가 독립적이라 차이가 없어야 정상입니다.

 

그리고 지금 핵심은 Extract from File 노드가 문제라면 구글 드라이브를 사용하냐 마냐는 중요한 요점은 아닌듯 합니다. 어차피 PDF 라면 결국 PDF 내용을 추출하는 기능이 있어야 하는데 Extract from File을 사용하지 않는다면 의미가 없고, 물론 텍스트 파일이라면 단순히 웹상 어딘가에 업로드 해놓고 Http Request 노드를 사용해 URL로 접근하여 텍스트 내용을 추출해오면 되긴 합니다.

 

아니면 n8n이 구동중인 도커 내부의 리눅스 경로에 (예를 들어 /tmp/sample.txt) 파일을 저장해놓고 n8n에서 Execute Command 노드를 사용하여 내부 텍스트 파일로 접근해서 파일을 읽어오는 방법도 있습니다.

 

또 다른 방법은 아예 해당 기능 자체를 분리하여 예를 들어 파일 주소를 넘겨주면 해당 PDF를 다운로드 하고 이를 파싱하여 텍스트로 변환하여 리턴해주는 파이썬 코드를 작성하고 이를 도커로 구동시켜서 API 처럼 사용하는 방법이 있을 수도 있습니다.

 

위의 방법중 첫째, 둘째 방법은 난이도상 쉬운 부분이라 생각되며 세번째 방법도 AI 를 통해 질문답변으로도 충분히 구현이 가능할 수 있지 않을까 생각됩니다. 더 궁금하신 사항 있으시면 추가 질문 주시기 바랍니다.

참고로 컴퓨터가 얼마나 예전 모델인지 모르겠지만 GPU 가 있고 없고 차이는 결국 Ollama 같은 로컬 AI를 쓰냐 마냐의 차이일뿐 n8n 자체를 구동하는데 그리 많은 리소스를 사용하지는 않으니 그 부분도 한번 참고해보시기 바랍니다.

이승현님의 프로필 이미지
이승현

작성한 질문수

질문하기