inflearn logo
강의

講義

知識共有

例として学ぶディープラーニング自然言語処理入門 NLP with TensorFlow - RNNからBERTまで

実習 1 - BERTを用いてIMDB Movie Review Datasetに関するText Classificationを行ってみる (BERT英語ファインチューニング)

bert를 이용해서 ocr 시스템을 만들려면 어떻게 해야 할까요 ?

787

YCorn

投稿した質問数 6

0

딥러닝 tensorflow NLP

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴이에요.

OCR(광학 문자 인식) 시스템을 개발하려면 BERT를 사용하고자 하시는군요. BERT는 단어 레벨의 임베딩이 아닌 문장 레벨의 임베딩을 제공해주기 때문에 텍스트 영역을 인식하는 모델로 활용될 수 있어요.

예를 들어, easyocr을 사용하여 텍스트 영역을 검출한 후, 해당 영역을 BERT에 입력하여 해당 영역의 텍스트를 추출할 수 있어요. 이때, BERT를 텍스트 영역의 크기에 맞게 fine-tuning하는 것이 좋을 수 있어요.

그런데 ‘ko-trocr’은 직접 훈련된 모델이 아닌 것 같아요. ‘ko-trocr’의 구체적인 세부 내용이나 문서화된 API를 찾아서 사용하시는 것이 좋을 것 같아요.

앞서 언급한 방법 외에도 OCR 시스템을 개발하기 위한 다양한 방법들이 존재합니다. 예를 들어, Tesseract, CRNN, DeepTextRecog 등 다른 OCR 엔진을 사용할 수도 있어요. 적절한 방법을 선택하려면 프로젝트의 요구사항과 데이터셋, 성능 등을 고려해보시는 것이 좋습니다.

더 좋은 방법이 있다면 공유드리겠지만, OCR 시스템을 개발하는 경우에는 위에서 설명한 방법 또는 다른 OCR 엔진을 사용하는 것이 일반적인 방법입니다.

추가적으로 OCR 시스템 개발에 대한 자세한 내용은 OCR 관련 강의나 문서를 참고하시는 것을 추천드립니다.

또한, OCR 시스템 개발 외에도 특정 문제 또는 기능에 대한 조언이 필요하면 언제든지 문의해주세요. 적극적으로 도와드리겠습니다.

도움이 되셨길 바라며, 추가적인 질문이 있으시면 언제든지 알려주세요. 좋은 하루 되세요!

import torch가 안되는 경우는 어떻게 하나요?

0

16

1

소리가 겹쳐서 들려요

0

20

2

가중치에 대한 질문

0

107

1

transformer 기계번역 강의 오류 질문

0

155

2

seq2seq를_이용한_NMT.ipynb 실습코드 에러 문의사항입니다.

0

254

2

실습 2 - Char-RNN 코드 학습 부분에서 오류가 발생합니다.

0

277

2

pad_both_ends 사용할 때 n은 왜 사용하나요?

1

206

2

트레이닝 에러 발생

0

335

2

트랜스포머 인코더 레이어 테스트 에러

0

219

1

9강 BERT 실습 예제 코드

0

465

1

Bert 관련 문의

0

336

2

코랩에서 실행이 안됩니다

0

1126

1

소스코드 실행 시 에러

0

565

2

N-gram_example

1

808

1

BERT를 이용한 텍스트 분류에서 다중분류라면 어떻게 해야할까요?

1

1524

1

개인 깃허브 소스코드 업로드 가능할까요?

0

331

1

#@title Choose a BERT model to fine-tune

0

370

1

nltk모듈 MLE의 score메서드 계산 질문드립니다.

0

202

0

bert 파인튜닝 코드 질문

0

397

0

네이버 영화리뷰 파인튜닝 질문드려요

0

306

1

코드 실행 오류

0

316

1

bert를 이용한 텍스트 분류 imdb 편 질문드립니다.

0

355

1

안녕하세요. 강의 잘듣고있습니다!

0

278

1

강의 자료는 어디있나요(자연어 처리)

0

333

1