강의

멘토링

커뮤니티

Data Science

/

etc. (Data Science)

本当に現場で通用するOCR、このように作ります。

実務で本当に使えるOCR技術を、しっかり学びたいならこの講座一つで完結! 非定型文書や複雑なレイアウトでも98%以上の精度を目指し、最新のSOTAモデルと実践ノウハウをもとに企業レベルのOCRプロジェクトを一緒に構築していきます。

難易度 初級

受講期間 無制限

  • nexthumans
Python
Python
AI
AI
openai
openai
openAI API
openAI API
Computer Vision(CV)
Computer Vision(CV)
Python
Python
AI
AI
openai
openai
openAI API
openAI API
Computer Vision(CV)
Computer Vision(CV)

学習した受講者のレビュー

学習した受講者のレビュー

4.6

5.0

lastadvance

100% 受講後に作成

OCRの理解と応用に本当に役立つ講義。 直接実習を追いかけていくうちに、理論まで理解できました。

受講後に得られること

  • データ精製からAIサービス連携まで、エンドツーエンドOCR実務プロジェクト

  • ディープラーニングベースのSOTA OCRモデル探究

講義紹介

現業で本物のOCR技術、ちゃんと学びたいならこの川のひとつで終わり!
非定型文書や複雑なレイアウトでも98%以上の精度を目指し、最新のSOTAモデルと実践ノウハウを基に企業レベルのOCRプロジェクトをまとめていきます。

  • 「チラシからチャットボットまで、本物のOCR実務に追いつく」

  • 「現業が望む98%精度OCR、こうする!」

  • 「複雑な文書もOK!最新OCR技術完全征服!」

  • 「実践中心のOCRプロジェクト、今すぐ始めましょう!」

#Python、#人工知能(AI)、#openai、#openAI API、#コンピュータビジョン

講義の説明

自動車ナンバープレート、名刺、契約書…今、そのようなOCRは基本です。
本物の現場は、Eマートのチラシのように複雑な非定型文書に直面します。

この講義では、単に文字を読むのにとどまらず、
📦データを洗練して
🧠AIサービスへの接続
📊インサイトまで導き出す
エンドツーエンドのOCRプロジェクトの流れを実践的に扱います。

ディープラーニングベースのSOTA OCRモデルから
実際のチラシデータを活用したプロジェクト構築、
そしてRAG、チャットボット、マーケティングインサイトまで!

実務ですぐに通じるOCRのすべてを一緒に学びましょう。

受講対象

  • 複雑な文書認識を扱う必要がある実務家やデータエンジニア

  • OCR技術を活用した実際のプロジェクトを設計したい方

  • RAGベースのAIサービスを準備中または興味のある方

  • ポートフォリオ向け実戦プロジェクトが必要な学生と就学生

学習目標

  • さまざまなOCRモデルの特徴と活用範囲を理解して比較することができます。

  • 非定型文書(チラシ、広告など)から必要な情報を精製された形式で抽出することができる。

  • OCRデータをRAGおよびAIサービスに関連付ける作業フローを設計できます。

  • 実戦でぶつかる問題状況(歪み、背景、フォントなど)を解決できるノウハウを備える。

  • 企業の実務で要求されるレベルの精度を達成するための戦略を理解する。

受講前の注意事項

事前知識

  • Pythonの基本文法

  • 必須ではありませんが、以下の内容がわかっている場合は学習に役立ちます。

    • Pandas、Numpyの使用経験

    • 機械学習とディープラーニング基礎概念

    • コンピュータビジョンまたはOCR技術への関心

使用ツールとライブラリ

  • 講義で使用される主な技術スタック:

    • Python 3.10以降


    • OpenCVNumpyを使用した画像の前処理および変換

    • OpenAI API

実習環境

  • ローカル環境で実習可能で、別途GPUはなくても受講可能


  • 練習コードは講義資料に付属しています

講義資料

  • すべての練習に必要なチラシ画像とコードサンプルを提供


その他の注意事項

  • 講義は実務中心のプロジェクトベースで構成されており、単純理論中心の講義ではない

  • 練習が含まれているので、受講中にPythonコードを直接実行してフォローすることをお勧めします

  • 継続的な改善のために講義中の質問は、コミュニティのQ&A講師のフィードバックチャンネルを介して問い合わせることができます。

こんな方に
おすすめです

学習対象は
誰でしょう?

  • 複雑な文書認識を扱う実務者およびデータエンジニア

  • OCR技術を活用した実際のプロジェクトを設計してみたい方

  • RAGベースのAIサービスを準備中の方や関心のある方

  • ポートフォリオ用の実践プロジェクトが必要な学生及び就活生

前提知識、
必要でしょうか?

  • パイソン プログラミング 基礎知識

こんにちは
です。

157

受講生

15

受講レビュー

27

回答

4.9

講座評価

3

講座

現在、大企業を中心に以下のようなプロジェクトの開発責任およびコンサルティングを担当しています。現役^^です。

あわせて、高麗大学大学院で人工知能関連の兼任教授としても活動しています。

私の目標は、実戦ですぐに活用できる臨場感あふれるプログラミング技術を伝えることです。これから多くの皆さんと共に、楽しい授業を作っていきたいと思っています。

  • エンタープライズAIアーキテクチャおよびサービス設計

  • 機械学習サービスの実装

  • バックエンドサービス開発

  • クラウド(Azure) Databricks、ETL、Fabricなど、各種クラウド環境におけるデータベース構築およびサービス開発

カリキュラム

全体

22件 ∙ (11時間 47分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

5件

4.6

5件の受講レビュー

  • lastadvance님의 프로필 이미지
    lastadvance

    受講レビュー 1

    平均評価 5.0

    5

    100% 受講後に作成

    OCRの理解と応用に本当に役立つ講義。 直接実習を追いかけていくうちに、理論まで理解できました。

    • kukuro9067님의 프로필 이미지
      kukuro9067

      受講レビュー 3

      平均評価 4.0

      4

      32% 受講後に作成

      • digitaltrans님의 프로필 이미지
        digitaltrans

        受講レビュー 9

        平均評価 5.0

        5

        32% 受講後に作成

        • fin4444님의 프로필 이미지
          fin4444

          受講レビュー 1

          平均評価 4.0

          4

          32% 受講後に作成

          • sjoh7998님의 프로필 이미지
            sjoh7998

            受講レビュー 15

            平均評価 5.0

            5

            64% 受講後に作成

            ¥13,433

            nexthumansの他の講座

            知識共有者の他の講座を見てみましょう!

            似ている講座

            同じ分野の他の講座を見てみましょう!