Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
BEST
AI Development

/

Natural Language Processing

みんなの韓国語テキスト分析と自然言語処理 with Python

Pythonによる韓国語テキスト分析と自然言語処理 ワードクラウドによる可視化、形態素分析、トピックモデリング、クラスタリング、類似度分析、テキストデータベクトル化のための Bag of Words と TF-IDF、機械学習とディープラーニングを活用したテキスト分類、Hugging Face の活用法

  • todaycode
이론 실습 모두
텍스트분석
자연어처리
NLP
Text Mining
Machine Learning(ML)
data-clustering
Big Data

学習した受講者のレビュー

こんなことが学べます

  • ワードクラウド視覚化

  • 形態素解析

  • トピックモデル

  • クラスタリング

  • 類似度分析

  • テキストデータベクトル化のための Bag of Words と TF-IDF

  • 機械学習とディープラーニング(RNN, LSTM)を活用したテキスト分類

  • Hugging Face を活用した BERT と koGPT2 の活用

📚テキスト分析と自然言語処理で複雑な文書から洞察を得る!

  • 💻言語の本質を理解し、テキストデータを効果的に前処理して分析する方法を学びます。

  • 🚀強力なNLPツールを扱い、ビジネス現場での実践能力を育て、より効果的な意思決定に役立つテキストマイニング技術を身につけます。 🛠📊

  • 🗝ビジネスを変える鍵をPythonのテキスト分析で見つけてください。 💬🔍

こんな方におすすめです

📊企画者、マーケティング担当者、アナリスト🕵‍♂️

  • 顧客フィードバック、FGI、質問、苦情、データ定性分析

  • オンライン商品レビューの評価と分析による市場トレンドの理解

  • 市場調査および競合製品ソーシャルメディア分析によるブランドモニタリング

🔬研究者🧪

  • ソーシャルメディアデータによる社会的相互作用と文化的現象の理解

  • 研究論文からの情報抽出

  • 膨大なニュース記事、演説文、特許、法律政策文書分析

🎓学生📚

  • テキストプロジェクトと課題の実行

  • 学術関連論文分析

  • テキストビッグデータベースの情報ナビゲーションによるデータリテラシー含量

  • テキストから洞察を得て問題解決能力を育てたい人

このようなことを学びます。

テキスト前処理

  • 正規表現、テキスト精製(Text Cleaning)


  • トークン化 (Tokenization)


  • 韓国語形態素分析器 KoNLPy

  • Pure Python 韓国語形態素アナライザ PeCab

  • 名詞抽出と

    品詞タグ付け (Part-of-Speech Tagging)

  • 語根抽出(Stemming)と見出し語抽出(Lemmatization)

  • 不用語処理(Stop Words)

ワードクラウドの可視化

単語のベクトル化

  • 単語頻度数の計算 (Term Frequency)

  • TF-IDF(Term Frequency-Inverse Document Frequency)

  • Word Embedding

単語ベクトル化によるトピックのモデリング

トピックモデリング、群集化、類似度分析

  • 潜在的なディリクレの割り当て (Latent Dirichlet Allocation, LDA)

  • 非負の行列分解(Non-Negative Matrix Factorization, NMF)

  • 文書のクラスタ化による類似文書のクラスタリング

  • 類似度分析による文書推薦と類似文書の検索

NMFトピックのモデリング

テキスト分類

  • 機械学習を利用したテキスト分類技術

  • 機械学習性能を向上させるためのハイパーパラメータのチューニング方法

  • 分類品質測定方法

  • テンサフローディープラーニングに基づく分類 DNN、RNN、LSTM

テキスト分類

テキストのベクトル化と埋め込みの違い

  • ベクトル化と埋め込みの違いを理解する

  • 埋め込みプロジェクターの使用

  • ディープラーニングモデルの使用

  • テンソルボードによるモデル性能の測定

  • BERTモデルを利用したテキスト分類と可視化

テンソルボードを利用したモデル性能評価

埋め込みプロジェクターの可視化

埋め込みプロジェクターによる単語の距離

ハギングペースの活用法と主要言語モデルタスクの理解

  • 自然言語の生成(Natural Language Generation)

  • 📖文書の要約(Document Summarization)


  • 🌐言語翻訳(Language Translation)

  • 最新のテキスト分析のトレンドと実務の適用方法

ハギングフェイス公式チュートリアルの活用法

講義を聞いたら、何を理解し、上手にできるようになりますか?

  • 📝トークン化(Tokenization)

    • テキストを個々の単語、フレーズ、文章などに分割します。

  • 🏷 品詞タグ付け ( Part -of-Speech Tagging)

    • 各トークン(単語)に品詞(名詞、動詞など)をタグ付けし、調査、句読点などを削除する方法を学びます。


  • 📚トピックモデリング、集団化、類似度分析

    • ドキュメントセットから隠しトピックを抽出します。

    • 同様のテキストをクラスタリングします。 (data-clustering)

    • 同様のテキストを検索または推奨します。

  • 📊テキスト分類 (Text Classification)

    • 文書を事前定義されたカテゴリに分類します。

  • 😃感性分析(Sentiment Analysis)

    • テキストで肯定的、否定的、中立的な感性を分析します。

  • 🔑キーワード抽出( Keyword Extraction)

    • テキストから重要なキーワードやフレーズを抽出します。


実習資料 - 実習用、実行用の2つのバージョンを提供

コードが入力されていない実習資料(*_input.ipynb)

コードが入力された実習資料(*_output.ipynb)

コードが入力されず、説明のみの実習資料(*_input.ipynb)ファイルと、コードと説明が入力された実習資料(*_output.ipynb)ファイルの提供でコードを見ながら従うこともできますし、コードなしで説明だけを見て直接実習をしてみることもできます。

理論資料

200ページを超える分量の自然言語処理(NLP)の核心内容を説明しているスライド資料提供

200 ページを超える分量のスライド素材

すべての韓国語テキスト分析の共著者

この講義を作った人

気になる内容
まず確認してみてください!
🙋‍♀

Q. 非専攻者も聞くことができますか?

Pythonの基礎文法を理解している場合は、形態素アナライザ、サイキランやパンダスのAPIを主に使用するので、非専攻者が十分に聞くことができます。さまざまな分野でテキスト分析を活用したい方のための講義です。企画者、マーケター、アナリスト、非IT系の研究者の方々がビジネスでテキストを活用することを目的に作られました。そのため、AIモデルを直接開発したり、底から数式を作成して分析したい人には合わない場合があります。

Q. YouTubeに公開されているみんなのテキスト分析本映像と同じですか?

この講座のほとんどがすべて新しく撮影された映像です。 YouTubeチャンネルに公開された映像は、Python、パンダス基礎、分類基礎、一部の内容が重なります。また、トピックモデリング、群集化、類似度分析、次元縮小、ディープラーニング活用についてはYouTubeにない内容をはるかに詳しく取り上げます。購入前にYouTubeの映像を通じて、自分が考えていた学習内容であることを確認してください。 => https://bit.ly/pytextbook-youtube

Q. 本の内容と同じですか?本も購入する必要がありますか?

本の内容と重なる部分もあり、そうでない部分もあります。トピックのモデリング、クラスタリングなどは本よりも詳細に扱われ、本のすべての例をカバーしていません。
本がなくても受講可能です。本は整理されたテキストで再整理したい方にお勧めします。

Q. コンピュータの性能はどの程度でなければ受講できますか?

8GB以上のメモリと残りのストレージスペースが20GB程度になるPCやノートパソコンであれば構いません。

Q. 授業内容をどの程度レベルまで扱いますか?

小さなフードレビューの例コーパスデータから始めて、ソウル120 FAQデータ、ショッピングレビュー、KLUEニューストピックデータまで取り上げます。
トークン化、形態素分析、トピックモデリング、群集化、類似度分析、機械学習の活用法を扱います。
ハギングフェイスを介して既存の共有モデルを活用する方法について説明します。

Q. 数学や確率、統計を扱いますか?

直接数学、確率、統計を求めずにサイキランやパンダス、テンサフロー、パイトーチ、ハギングフェイスを活用します。

受講前の注意

こんな方にはおすすめしません。 🚫

  • 🙅‍♂LLMモデルの数学的計算法と原理を学び、LLMモデルを底から作りたい方

  • 🙅‍♂LLMベースのAIサービスを開発したい人

練習環境

  • オペレーティングシステムとバージョン(OS):PythonがインストールされていてJupyterまたはColabが使用している場合は、どのオペレーティングシステムに関係ありません。

  • 使用ツール:JupyterまたはGoogle Colabを使用してください。

  • PC仕様:RAM 8G以上と20Gのストレージ空き容量があれば十分に受講可能です。

学習資料

  • colabを介した練習リンクとジュピターノートブックファイルを提供します。

  • 説明とコードが入力された資料と説明だけが入力されており、直接練習できるファイル2つを提供します。

InflearnプレビューまたはYouTube チャンネルを通じて公開されたいくつかのクラスを最初に聞いて、受講するかどうかを決定してください。

受講前にいくつかのクラスをプレビューできます。希望の学習方向であることを確認してください。 ( => https://bit.ly/pytextbook-youtube )またご質問がある場合は、受講前のお問い合わせからお問い合わせください。 YouTubeの内容以外の授業では、はるかに多様なタスクとディープラーニング活用法について YouTubeにない内容をより詳しく取り上げます。

選手の知識と注意事項

  • Pythonの基礎文法の理解が必要です。

  • JupyterまたはGoogle Colaboratoryの使用方法を知っておく必要があります。


こんな方に
おすすめです

学習対象は
誰でしょう?

  • テキスト分析が必要なビジネス専門家

  • 研究や論文でトピックモデリングや類似度分析が必要な研究者

  • テキスト分析プロジェクトをしようとしている学生

  • テキスト分析のポートフォリオを作成したい就職活動生

前提知識、
必要でしょうか?

  • Pythonの基本文法

  • Jupyter Notebook、またはGoogle Colaboratory の使い方

こんにちは
です。

18,787

受講生

787

受講レビュー

1,334

回答

4.9

講座評価

6

講座

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

カリキュラム

全体

53件 ∙ (18時間 6分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

20件

4.8

20件の受講レビュー

  • 런던베이글님의 프로필 이미지
    런던베이글

    受講レビュー 7

    平均評価 5.0

    5

    100% 受講後に作成

    네이버 부스트코스에서 박조은강사님 강좌 수강이후에 - 파이토치, 텐서플로우 기본 학습하고 이어서 진행했습니다. 비전공자가 듣기 쉽고 좋으며 90%이상 프로젝트실습 위주여서 추천드립니다... 어렵게 학습했던 딥러닝에 대해서 개념을 쉽게 다시 이해하기에도 좋았습니다. 유튜브에서 진행 하시는 마케팅분석도 강의로 제공해주시면 좋을거같습니다

    • geogeo2020님의 프로필 이미지
      geogeo2020

      受講レビュー 2

      平均評価 5.0

      5

      100% 受講後に作成

      • ssyeonh님의 프로필 이미지
        ssyeonh

        受講レビュー 2

        平均評価 5.0

        5

        30% 受講後に作成

        • iklee님의 프로필 이미지
          iklee

          受講レビュー 1

          平均評価 5.0

          5

          60% 受講後に作成

          • 임지수님의 프로필 이미지
            임지수

            受講レビュー 1

            平均評価 5.0

            5

            100% 受講後に作成

            좋은 내용 잘 들었습니다.

            ¥9,105

            todaycodeの他の講座

            知識共有者の他の講座を見てみましょう!

            似ている講座

            同じ分野の他の講座を見てみましょう!