강의

멘토링

로드맵

Inflearn brand logo image
Data Science

/

etc. (Data Science)

本当に現場で通用するOCR、このように作ります。

実務で本当に使えるOCR技術を、しっかり学びたいならこの講座一つで完結! 非定型文書や複雑なレイアウトでも98%以上の精度を目指し、最新のSOTAモデルと実践ノウハウをもとに企業レベルのOCRプロジェクトを一緒に構築していきます。

  • nexthumans
실습 중심
AI 코딩
ocr
문서인식
Azure
Python
AI
openai
openAI API
Computer Vision(CV)

こんなことが学べます

  • データ精製からAIサービス連携まで、エンドツーエンドOCR実務プロジェクト

  • ディープラーニングベースのSOTA OCRモデル探究

講義紹介

現業で本物のOCR技術、ちゃんと学びたいならこの川のひとつで終わり!
非定型文書や複雑なレイアウトでも98%以上の精度を目指し、最新のSOTAモデルと実践ノウハウを基に企業レベルのOCRプロジェクトをまとめていきます。

  • 「チラシからチャットボットまで、本物のOCR実務に追いつく」

  • 「現業が望む98%精度OCR、こうする!」

  • 「複雑な文書もOK!最新OCR技術完全征服!」

  • 「実践中心のOCRプロジェクト、今すぐ始めましょう!」

#Python、#人工知能(AI)、#openai、#openAI API、#コンピュータビジョン

講義の説明

自動車ナンバープレート、名刺、契約書…今、そのようなOCRは基本です。
本物の現場は、Eマートのチラシのように複雑な非定型文書に直面します。

この講義では、単に文字を読むのにとどまらず、
📦データを洗練して
🧠AIサービスへの接続
📊インサイトまで導き出す
エンドツーエンドのOCRプロジェクトの流れを実践的に扱います。

ディープラーニングベースのSOTA OCRモデルから
実際のチラシデータを活用したプロジェクト構築、
そしてRAG、チャットボット、マーケティングインサイトまで!

実務ですぐに通じるOCRのすべてを一緒に学びましょう。

受講対象

  • 複雑な文書認識を扱う必要がある実務家やデータエンジニア

  • OCR技術を活用した実際のプロジェクトを設計したい方

  • RAGベースのAIサービスを準備中または興味のある方

  • ポートフォリオ向け実戦プロジェクトが必要な学生と就学生

学習目標

  • さまざまなOCRモデルの特徴と活用範囲を理解して比較することができます。

  • 非定型文書(チラシ、広告など)から必要な情報を精製された形式で抽出することができる。

  • OCRデータをRAGおよびAIサービスに関連付ける作業フローを設計できます。

  • 実戦でぶつかる問題状況(歪み、背景、フォントなど)を解決できるノウハウを備える。

  • 企業の実務で要求されるレベルの精度を達成するための戦略を理解する。

受講前の注意事項

事前知識

  • Pythonの基本文法

  • 必須ではありませんが、以下の内容がわかっている場合は学習に役立ちます。

    • Pandas、Numpyの使用経験

    • 機械学習とディープラーニング基礎概念

    • コンピュータビジョンまたはOCR技術への関心

使用ツールとライブラリ

  • 講義で使用される主な技術スタック:

    • Python 3.10以降


    • OpenCVNumpyを使用した画像の前処理および変換

    • OpenAI API

実習環境

  • ローカル環境で実習可能で、別途GPUはなくても受講可能


  • 練習コードは講義資料に付属しています

講義資料

  • すべての練習に必要なチラシ画像とコードサンプルを提供


その他の注意事項

  • 講義は実務中心のプロジェクトベースで構成されており、単純理論中心の講義ではない

  • 練習が含まれているので、受講中にPythonコードを直接実行してフォローすることをお勧めします

  • 継続的な改善のために講義中の質問は、コミュニティのQ&A講師のフィードバックチャンネルを介して問い合わせることができます。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • 複雑な文書認識を扱う実務者およびデータエンジニア

  • OCR技術を活用した実際のプロジェクトを設計してみたい方

  • RAGベースのAIサービスを準備中の方や関心のある方

  • ポートフォリオ用の実践プロジェクトが必要な学生及び就活生

前提知識、
必要でしょうか?

  • パイソン プログラミング 基礎知識

こんにちは
です。

106

受講生

10

受講レビュー

16

回答

4.9

講座評価

3

講座

현재 대기업 중심으로 아래와 같은 프로젝트의 개발책임 및 컨설팅을 맡고 있습니다. 현역^^입니다.

더불어, 고려대 대학원에서 인공지능 관련 겸임교수로도 활동하고 있습니다.

저의 목표는 실전에 바로 써먹을 수 있는 현장감 있는 프로그래밍 기술입니다. 앞으로 많은 여러분과 함께 재미난 수업 만들어 나가고 싶습니다.

  • 엔터프라이즈 인공지능 구조 및 서비스 설계

  • 머신러닝 서비스 구현

  • 벡엔드 서비스 개발

  • 클라우드(Azure) Databricks, ETL, Fabric 등 각종 클라우드 환경에서의 데이터베이스 구축 및 서비스 개발

カリキュラム

全体

22件 ∙ (11時間 47分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

2件

4.5

2件の受講レビュー

  • sjoh7998님의 프로필 이미지
    sjoh7998

    受講レビュー 13

    平均評価 5.0

    5

    64% 受講後に作成

    • fin4444님의 프로필 이미지
      fin4444

      受講レビュー 1

      平均評価 4.0

      4

      32% 受講後に作成

      ¥12,899

      nexthumansの他の講座

      知識共有者の他の講座を見てみましょう!

      似ている講座

      同じ分野の他の講座を見てみましょう!