작성
·
50
0
혹시 n8n에서 이미지를 분석해주는 ai 모델도 만들수있을까요.
간단하게 구현을 해봤는데, 이미지를 인식하는 정확도가 떨어지네요.
이미지를 다운받을수있는 url을 ai-agent에게 던져주고 ai모델은 gpt4o, 4.1, 5까지 사용해보고
gemini 2.5pro로도 테스트를 해봤는데 정확도가 높지가 않네요
혹시 정확도를 높이는 팁이 있을까요?
답변 2
0
안녕하세요! 좋은 질문 감사합니다.
인식률이 떨어지는 부분은 모델의 영역이라 사실상 해당 API를 활용하는 입장에서 크게 할 수 있는게 없는 상황입니다. 아마 더 좋은 화질의 고용량 이미지를 활용하는 방법을 시도해볼 수 있을 것 같아요
만약 이미지 내 텍스트 인식을 원하신다면 upstage 에서 제공하는 document parser를 추천 드립니다
0
안녕하세요, 인프런 AI 인턴입니다. Dean Kho님께서 질문하신 이미지 분석의 정확도 문제에 대해 살펴보겠습니다.
n8n에서 이미지를 분석하는 AI 모델을 사용할 때 이미지 인식 정확도를 높이기 위해 고려할 수 있는 몇 가지 팁을 소개합니다:
데이터 품질 향상: 분석할 이미지의 품질이 중요합니다. 가능한 한 고해상도의 이미지를 사용하고, 불필요한 노이즈를 줄이도록 합니다.
전처리 과정: 이미지의 전처리를 통해 분석 성능을 높일 수 있습니다. 예를 들어, 이미지 크기 조정, 색상 보정, 노이즈 제거 등을 수행해 보세요.
모델 조정 및 최적화: 사용하는 모델의 하이퍼파라미터를 조정하거나 특정 문제에 맞춰 미세 조정 작업을 수행함으로써 성능을 개선할 수 있습니다.
다양한 모델 테스트: 여러 모델을 비교하여 테스트해보는 것이 중요합니다. 최신 모델이라고 모두 성능이 좋은 것은 아니므로, 실제 데이터에 맞는 모델을 선택하는 것이 중요합니다.
Feedback Loop 도입: 이미지 분석 결과물에 대한 피드백 루프를 도입하여 모델의 학습에 반영할 수 있습니다. 잘못된 결과에 대한 교정을 통해 모델을 개선할 수 있습니다.
특이점 처리 및 예외 관리: 특정 상황이나 입력에서의 성능 변화를 관리하며, 예외 상황을 처리할 수 있는 로직을 추가해 보세요.
아래의 관련 질문이 도움이 되실 수 있습니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.