inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

RAG를 활용한 LLM Application 개발 (feat. LangChain)

4.1 Streamlit 설치와 user message 작성

docx에 표

해결된 질문

195

rosy

작성한 질문수 21

1

안녕하세요! 강의 잘 듣고 있습니다

강의에서 docx 내부의 표를 markdown으로 변경하셨던데,

그러면 docx 문서를 전부 훑어서 모든 표를 markdown으로

일일이 수정해야할까요?

혹시 좀 더 간편한 방법이 있는 건 아닌지 궁금하여 여쭤봅니다!

vector-database llm langchain rag openai-api

답변 1

2

제이쓴

안녕하세요! 일일이 수정하는 것이 정확도는 제일 높겠지만, 말씀하신 것처럼 매우 비효율적입니다. 제가 사용해본 데이터를 수정하는 방법은 총 3가지가 있는데요

 

  1. LLM의 multimodal 기능을 활용해서 변환

  2. python-docx 패키지를 활용해서 row들을 읽어서 markdown으로 변환

  3. Upstage Layout Analysis를 활용해서 변환

1번은 솔직히 성능이 너무 오락가락하고,

2번을 활용해서 코드를 잘 작성한다면 제일 안정적이고,

비용이 문제가 안된다면 3번이 현시점에서는 제일 간단한 방법인것 같습니다. 2번으로 코드를 작성하기 전에 회원가입하면 $30 크레딧을 주기 때문에 3번을 한번 시도해보시고 성능을 한번 검증해보시는 것을 추천드립니다!

0

rosy

답변 감사합니다! 강사님은 성능 확인은 어떤식으로 하시는 지 알 수 있을까요?

0

제이쓴

저는 성능 평가를 위한 정답지(Golden Dataset)을 기반으로 LLM을 활용해서 (LLM as judge) 확인하고 있습니다~

소득세법 docx 파일 공유 요청건

0

65

1

EXAONE 모델 불러오기 안되는 문제

0

89

2

[5.1 강의] LLM Evaluator에 Upstage를 사용하는 방법 + 변경된 Langsmith Docs를 참고하여 구현하는 방법 공유

0

104

2

강의 9에 QA관련된 import가 되지 않네요

0

111

2

🚨 python3.14 를 쓰고 계시면 chroma 에서 ConfigError 가 발생합니다.

1

200

1

강의와 책 관련 질문

0

87

1

문서 전처리 고민

0

111

1

RAG 배포 질문드립니다

0

95

1

강의 내용과는 별개로 궁금한 점이 있습니다

0

89

2

폐쇄망 챗봇 모델

0

94

1

AI agent 쿠폰

0

95

2

저는 왜 그대로 했는데 답변이 틀리게 나오는지 모르겠네요

0

102

2

langchain howto/sequence는 지금 doc 공식 사이트 어디서 확인할 수 있나요?

1

95

1

new_question에 대한 답 출력

0

74

2

랭체인 라이브러리

0

148

2

[LangGraph를 활용한 AI Agent 개발] 쿠폰 유효기간

0

106

1

postgresql의 pgvector 벡터는 어떤가요?

0

345

2

doc관련

0

128

2

load_dotenv() 실행 False

0

96

1

RAG 답변 개선을 위한 정답지 활용 구조 검토 요청

0

119

2

3.2 from langchain.chains ~ 에서 모듈을 찾지 못할 때.

1

406

2

강의 완료 오류

0

89

1

hub.pull 이슈

0

131

2

[3.3 강의] Upstage를 사용한 RAG 구현 성공기 공유

1

150

1