작성자 없음
작성자 정보가 삭제된 글입니다.
작성
·
2
0
해당 강의에 대한 질문으로 적절한지는 모르겠지만, 우선은 모든 강의를 수강하고 질문을 드려봅니다.
혹시라도 제가 하는 질문이 답변할 영역을 넘어간다고 생각되신다면, 그냥 궁금한 게 많구나 하고 지나가 주세요. (미리 죄송합니다.)
RDB 데이터 - 가지고 있는 데이터가 문서인 경우도 있지만, RDB 테이블에 저장된 데이터일 경우가 많을 것 같은데, 그럴 경우 해당 데이터를 문서화해서 임베딩해야 하나요?
예제로 사용하신 vector db가 pinecorn과 chroma인데, 실제 서비스를 구축하는 경우에도 두 vector db를 사용하는지가 궁금하고 아니라면 어떤 vector db를 사용하는 게 좋은가요?
끝으로 좋은 강의 정말 감사합니다. 최대한 열심히 씹어서 습득해보고 다음 강의까지 달려보도록 하겠습니다.^^
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
ysparkr841님, 질문 남겨주셔서 감사합니다. 데이터 관련 질문에 대해 답변드리겠습니다.
RDB 데이터와 문서화: RDB 데이터가 테이블 형태로 저장되어 있는 경우, 해당 데이터를 문서화하여 임베딩하는 것이 좋은지에 대한 질문인데요. 데이터의 성격에 따라 다를 수 있지만, 만약 텍스트 기반의 분석이나 검색을 위한 임베딩을 하신다면 데이터를 문서화하여 임베딩하는 것이 효과적일 수 있습니다. 이는 데이터의 구조적 정보를 보존하면서도 텍스트 기반의 처리 방식을 가능하게 만듭니다.
Vector DB 선택: 예제로 사용된 pinecone과 chroma는 대표적인 벡터 데이터베이스로, 실제 서비스에 적합할 수 있습니다. 다만 프로젝트의 요구사항과 성능 조건에 따라 다른 선택이 필요할 수도 있습니다. Pinecone은 높은 확장성과 빠른 검색 성능으로 알려져 있으며, Chroma는 오픈 소스로 커스터마이징이 쉽게 가능합니다. Vector DB를 선택할 때는 데이터의 크기, 사용 사례, 라이센스 정책 등을 고려하여 선택하시는 것이 좋습니다.
마지막으로 강의에 대한 긍정적인 피드백 감사합니다. 열심히 공부하시고 다음 강의에서도 많은 것 배워가시기 바랍니다. 추가 질문이 있다면 언제든지 문의하세요! 😊
원하는 답변을 찾지 못하셨다면, 강의 관련 문의는 수강 전 문의 게시판을 통해 질문을 남겨주실 수도 있습니다. 그래도 해결되지 않는 부분이 있다면, 우측 하단의 ‘문의하기’를 통해 직접 문의해주시면 최대한 빠르게 답변드리도록 하겠습니다!