묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨진짜 현장에서 통하는 OCR, 이렇게 만듭니다.
실무 OCR을 위한 심도 질문
안녕하세요? 강사님실무에 적용할 수 있는 상세 내용과 강사님만의 know-how를 알려 주셔서 감사합니다.더 깊게 이해하고 싶은 마음에 다소 질문이 길고 복잡한 점을 이해해 주시면 감사하겠습니다.1. 최신 OCR model 성능을 보여주셨는데, 결국은 multi modal LLM을 쓰면 만사 능통한 것처럼 결론이 내려집니다. 그렇다면 OCR model보다는 image처리가 가능한 LLM model 비교하는 게 더 맞다고 생각이 듭니다. 어떻게 생각하시나요?2. LLM image처리가 좋아짐으로써, 굳이 opencv로 처리하지 않아도 그 결과가 좋을 것 같습니다. 앞으로도 이러한 작업이 필요할까요? (그냥 LLM에 넣는 것과 opencv로 전처리한 것과 비교하는 실험도 첨부해 주셨으면 좋겠습니다.)3. 보통 기업에서 OCR을 사용할 때는 개인정보를 포함한 문서가 많습니다. 외부 LLM 사용을 꺼릴 때가 많습니다. sLLM으로 처리하고 싶은데, function calling이나, pydantic과 같은 양식 처리가 어렵습니다. 어떻게 해결할 수 있을까요?4. pipeline을 정리하면,opencv 전처리 -> cropping -> LLM 구조입니다. 원하는 양식대로 만드는 작업은 LLM 성능과 prompt의 역량으로 보입니다. 문제는 문서의 양식이 다양해서 한 문서 양식을 추출할 때마다 복잡한 prompt를 작성해야 하는 것일까요? 또한 문서 종류가 달라질 때마다 수정해야 할까요?만약 이러한 것이라면 기존 OCR과 같이 문서 종류별로 OCR format이 다 다르게 정해져야 할텐데, 어떻게 해결할 수 있을까요?전단지말고 다른 여러 문서들도 똑같이 적용될 수 있는지 다양한 문서들에 대한 OCR 작업 예시 강의를 더 올려주시길 바랍니다.
-
해결됨진짜 현장에서 통하는 OCR, 이렇게 만듭니다.
전체 코드는 어디에서 볼 수 있나요?
감사합니다.
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
모델 변환 성능 질문드립니다.
안녕하세요 선생님 강의 잘 듣고 있는 학생입니다. 요즘 저의 custom dataset으로 여러 object detection 모델을 돌려보고 있는데 시작은 보통 pytorch의 pt모델로 학습을 시작을 하는데제가 임베디드 시스템에서 돌려보고 싶어서 추론을 하고 싶어PyTorch -> onnx -> tensorflow -> tflite 변환 구조를 따라가 최종 모델을 tflite로 구성하려고 하는데양자화를 하지 않았는데도 tflite(float32) 성능이 아예 떨어져 pytorch에서는 잘 detect하던 모델이 아예 검출을 하지 못하는 상황이 발생하는데 혹시 이러한 상황이 아무래도 모델을 tflite로 축소하다 보니 자연스러운 상황인건지 이러한 상황을 극복하려면 데이터를 더 수집해서 성능을 높여야하는지 방법에 대해서도 좀 여쭙고 싶습니다.감사합니다~
-
미해결딥러닝 CNN 완벽 가이드 - Pytorch 버전
feature map 크기 질문
안녕하세요 (퀴즈 - 출력 Feature Map으로 적용된 Conv 찾기 강의)밑의 그림의 27*27*256 feature map이 잘 이해가 가지 않습니다. 5*5 커널을 적용했다면 사이즈가 12*12*256이 되어야 하지 않나 생각이 들어서요~!
-
미해결딥러닝 이론 + PyTorch 실무 완전 정복
섹션12 실습코드 의 initialization 각각 적용 코드 문의
실습코드에서 초기화 각각 적용 부분 self._init_weights(self.fc_layers[0], mode='kaiming') self._init_weights(self.fc_layers[1], mode='kaiming') self._init_weights(self.fc_layers[2], mode='xavier') 모델을 읽어보면 NeuralNetwork( (fc_layers): Sequential( (0): Linear(in_features=784, out_features=196, bias=True) (1): ReLU() (2): Linear(in_features=196, out_features=49, bias=True) (3): ReLU() (4): Linear(in_features=49, out_features=10, bias=True) (5): Sigmoid() ) ) 0, 2,4 번에 초기화를 적용해야 실제 작동을 할 것 같습니다.
-
미해결최신 딥러닝 기술과 객체인식
카메라달린 자동차가 특정물체를 계속 따라가는 주행을 하게하기위한 학습으로 Yolo4를 이용해야하는 학교 과제가 있어서 질문드립니다.
안녕하세요 선생님 과제를 해야하는데 제가 너무 초보자라.. 코랩에서 Yolo4 다운받아서 학습 시켜야하는데 기틀이 없어서 Yolo강의 검색해서 여기 플랫폼을 타고들어와서 Yolo강의 중에 이렇게 선생님 강의를 신청해서 시작하게 되었습니다.Yolo4로 모델을 학습시킨다 할때 방법에 대한 대략의 팁을 살짝이라도 주시면 감사드리겠습니다.제가 모델 학습시켜본 경험도 없고 너무 틀이 없어서 GPT한테 물어도 자꾸 오류나고 결과물을 낼 수 없는 등 이 상태에서 뭘 할 수가 없네요. Yolo4를 이용한 학습시키려면 어떻게해야 하는지 대략적인 틀이라도 잡힐 수 있는 살짝의 팁의 말씀을 부탁드리고 싶습니다. 아니시면 GPT에게 모델학습 시키는데 어떻게 질문해야 하는지라도 남겨주시면 너무 감사드리겠습니다. 감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
NMS 로직 문의 드려요
안녕하세요 NMS 이해에서 NMS 수행로직 설명하시는 부분에서요Confidense score가 높을수록 많으 박스가 제거 된다고 하는데 Confidence score인지 Confidence threshold인지 헷갈립니다. threshold가 높아야 이 threshold보다 낮은 박스들은 모두 제거 되지 않을까 해서요
-
미해결[라즈베리파이] IoT 딥러닝 Computer Vision 실전 프로젝트
RBP_DL01_Raspberry pi inatall 문서 다운로드위치는?
유트브 영상참조해서크리애플 사이트가서 찾아봐도..문서는 찾을수가 없네요아래 사진처럼만 나옵니다..문서는 안보이네요
-
미해결C# OpenCV 컴퓨터비전 입문 강좌
카메라 출력 질문
저도 카메라를 이용해서 출력하고 싶은데 어떤 카메라를 구매해야하나요?
-
미해결딥러닝 CNN 완벽 가이드 - Pytorch 버전
sumation 과 코드대응
sumation 은 코드의 어떤 부분으로 대응되는지 궁금합니다 bias update 부분도 마찬가지로 궁금합니다
-
미해결C# OpenCV 컴퓨터비전 입문 강좌
설치문제
OpenCV설치에서 1:59를 하고 있습니다. 근데 도구상자에서 ipl이 검색이 되지 않습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
선생님, yolov2.weights파일 구할 수 있을까요?
https://pjreddie.com/darknet/yolo/선생님 원래는 위의 링크에서 다운이 되었는데개발자가 군사목적으로 쓰이는 것을 원치 않아서 업데이트 중단한다.어쩌고 한다음에 이제 weight파일도 다운로드가 안되요혹시 구글 드라이브 같은데에 올려주실수 있을까요?부탁드립니다
-
해결됨딥러닝 CNN 완벽 가이드 - Pytorch 버전
EfficientNet V2 M 모델로 학습 후 성능 평가
안녕하세요.강의 잘 듣고 있습니다."EfficientNet V2 M 모델로 학습 후 성능 평가" 강의 동영상이 Weight Decay 강의로 재생되는 것 같습니다.
-
미해결딥러닝 이론 + PyTorch 실무 완전 정복
오타
안녕하세요.7:13에 맨 오른쪽아래에 XN(t+1)에서 M인데 N으로 오타가 있습니다.
-
미해결딥러닝 CNN 완벽 가이드 - Pytorch 버전
Sequential을 이용하여 모델 만들기
이거 케글 파일은 어디있나요..?없는것 같은데..그 직전 2개 강의랑..
-
해결됨딥러닝 이론 + PyTorch 실무 완전 정복
혹시 이론강의 자료도 공유가 가능하실까요?
안녕하세요 변정현 강사님.강의 잘 듣고있습니다. 실습 수업 때는 주피터 노트북 형식으로 강의자료 다운로드가 가능한데, 혹시 이론강의 자료도 공유가 가능하신가해서 질문을 드립니다. 내용만 볼수있으면 pdf형식이나 워터마크가 추가되어도 크게 문제가 없을것 같은데, 혹시 가능하실까요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
ROC-AUC와 F1-max, 어떤게 FN에 반응이 빠른가?
안녕하십니까, 강의에서 배운 평가지표를 이용하여 anomaly detection을 진행하고자 합니다.문제는 다음과 같습니다.anomaly detection에서는 TN(이상이 없다고 잘 예측함)비율이 압도적으로 많은 상황입니다. 제 생각에는 ROC-AUC에서 FN 비율이 높아져도 FP비율이 낮다면, 여전히 ROC-AUC에서는 높은 성능을 보인다 생각했습니다.따라서 FN에 linear하게 반응하는 F1-max를 사용하고자 했습니다.하지만 주변에서 다음과 같은 답변을 받았습니다.Anomaly detection을 위핸 manual threshold가 문제라는 것 같네요. 해당 부분 분명히 문제가 맞습니다.하지만 이 부분이 AUROC라는 평가지표가 잘못되었다라는 주장을 하기에는 적절한지 아직 의문입니다.AUROC는 다양한 threshold를 두어 종합적으로 평가하기 때문입니다. 개인적으로 TN의 비율이 압도적인 것은 anomaly를 탐지하는 AD에서는 문제가 되지 않는다고 생각합니다. AUROC에서 역시 TN은 사용되지 않습니다. 모델이 모든 샘플에 대해 normal이라고 말하거나 혹은 그 반대여도 역시 AUROC는 낮아집니다 물론 F1-max도 중요하지만, 제 생각에는 여전히 AUROC로 평가하는 것은 유의미합니다.하여, 의견이 궁금하기에 글 남깁니다.이상입니다.
-
미해결[AI 실무] AI Research Engineer를 위한 논문 구현 시작하기 with PyTorch
추후 scratch부터 해볼만한 모델을 추천받을 수 있을까요?
안녕하세요.강의 잘 들었습니다!이제 막 AI 를 학습하고 있는 학부생인데, 너무너무 필요했던 정보들이라 좋았습니다.혹시 해당 논문 외에, Transformer 구조를 가진 모델 중에 직접 스크래치부터 구현을 도전해볼만한 게 있는지 여쭤보려고 합니다. 물론 이것 저것 제가 원하는 모델을 해봐야겠지만... 이 분야에서 좀 더 잘 아시는 분에게 전반적인 로드맵을 추천 받고 싶어서요!
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
겹치는 영역에 대한 질문
이미지 내에서 겹치는 이미지는 어떻게 학습을 해야하나요 실제 이미지에서는 데이터가 겹치는 경우도 많은데이런 경우에 어떻게 해결하는지요?감사합니다.
-
미해결딥러닝 CNN 완벽 가이드 - Pytorch 버전
lr_scheduler 관련 질문 있습니다.
안녕허세요.강의 잘 보고 있습니다.옵티마이저 Adam과 RMSprop 은 자동으로 lr 를 조정한다고 배운 것 같습니다. lr_scheduler 이하 모듈들의 lr 조정과 차이가 무엇인가요?