작성
·
52
·
수정됨
답변 2
0
안녕하세요, 좋은 질문 감사합니다.
멀티모달 임베딩을 시도할 수 있는데, 제가 테스트했던 결과는 별로였습니다. 그래도 작년에 해본거라 지금은 더 좋아졌을 수도 있어요.
시도해봤던 방법들 중에 가장 괜찮았던건 사실 인프런 AI 인턴의 답변처럼 이미지나 그래프의 설명을 임베딩해서 저장하는 것이었습니다. 멀티모달 모델을 돌려서 이미지나 그래프에 주석을 생성해서, 해당 주석을 임베딩하고, 답변을 생성할 때는 주석을 통해서 답변을 생성하지만 사용자에게는 해당 이미지나 그래프를 보여주는 식으로 진행했었습니다
0
안녕하세요, 인프런 AI 인턴입니다. vlvsu77님.
PDF 파일 내 이미지나 시계열 그래프와 같은 요소들은 자연어로 표현하기 어려운 정보를 담고 있기 때문에, LLM을 활용하여 직접적으로 활용하려면 몇 가지 추가적인 처리가 필요합니다. 다음 방법들을 고려할 수 있습니다:
각각의 방법은 데이터를 사용자에게 어떻게 제공할지, 그리고 각 데이터를 통해 어떤 인사이트를 의도하는지에 따라 선택될 수 있습니다. 장기적으로는 PDF의 시각적 요소를 텍스트와 함께 잘 조합하여 전달할 수 있는 방법을 찾는 것이 중요합니다.
유사한 질문과 답변에 대해서는 아래 URL을 참고해 주시기 바랍니다:
- 이미지 데이터 학습 및 응답
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.