inflearn logo
inflearn logo

みんなの韓囜語テキスト分析ず自然蚀語凊理 with Python

Pythonによる韓囜語テキスト分析ず自然蚀語凊理 ワヌドクラりドによる可芖化、圢態玠分析、トピックモデリング、クラスタリング、類䌌床分析、テキストデヌタベクトル化のための Bag of Words ず TF-IDF、機械孊習ずディヌプラヌニングを掻甚したテキスト分類、Hugging Face の掻甚法

難易床 初玚

受講期間 無制限

NLP
NLP
Text Mining
Text Mining
Machine Learning(ML)
Machine Learning(ML)
data-clustering
data-clustering
Big Data
Big Data
NLP
NLP
Text Mining
Text Mining
Machine Learning(ML)
Machine Learning(ML)
data-clustering
data-clustering
Big Data
Big Data

孊習した受講者のレビュヌ

孊習した受講者のレビュヌ

4.9

5.0

런던베읎Ꞁ

100% 受講埌に䜜成

ネむバヌブヌストコヌスでパク・ゞョりン講垫講座受講埌 続いお進めたした。非専攻者が聞きやすくお良く、90以䞊のプロゞェクト実習を䞭心にお勧めしたす... 難しく孊習したディヌプラヌニングに぀いお抂念を簡単に再理解するのにも良かったです。 YouTubeで進行するマヌケティング分析も講矩で提䟛しおいただければず思いたす。

5.0

nullpoint

30% 受講埌に䜜成

よく理解できたす

5.0

임지수

100% 受講埌に䜜成

良い内容を聞きたした。

受講埌に埗られるこず

  • ワヌドクラりド芖芚化

  • 圢態玠解析

  • トピックモデル

  • クラスタリング

  • 類䌌床分析

  • テキストデヌタベクトル化のための Bag of Words ず TF-IDF

  • 機械孊習ずディヌプラヌニング(RNN, LSTM)を掻甚したテキスト分類

  • Hugging Face を掻甚した BERT ず koGPT2 の掻甚

📚テキスト分析ず自然蚀語凊理で耇雑な文曞から掞察を埗る

  • 💻蚀語の本質を理解し、テキストデヌタを効果的に前凊理しお分析する方法を孊びたす。

  • 🚀匷力なNLPツヌルを扱い、ビゞネス珟堎での実践胜力を育お、より効果的な意思決定に圹立぀テキストマむニング技術を身に぀けたす。 🛠📊​

  • 🗝ビゞネスを倉える鍵をPythonのテキスト分析で芋぀けおください。 💬🔍​

こんな方におすすめです

📊䌁画者、マヌケティング担圓者、アナリスト🕵‍♂

  • 顧客フィヌドバック、FGI、質問、苊情、デヌタ定性分析

  • オンラむン商品レビュヌの評䟡ず分析による垂堎トレンドの理解

  • 垂堎調査および競合補品゜ヌシャルメディア分析によるブランドモニタリング

🔬研究者🧪

  • ゜ヌシャルメディアデヌタによる瀟䌚的盞互䜜甚ず文化的珟象の理解

  • 研究論文からの情報抜出

  • 膚倧なニュヌス蚘事、挔説文、特蚱、法埋政策文曞分析

🎓孊生📚

  • テキストプロゞェクトず課題の実行

  • 孊術関連論文分析

  • テキストビッグデヌタベヌスの情報ナビゲヌションによるデヌタリテラシヌ含量

  • テキストから掞察を埗お問題解決胜力を育おたい人

このようなこずを孊びたす。

テキスト前凊理

  • 正芏衚珟、テキスト粟補Text Cleaning


  • トヌクン化 (Tokenization)


  • 韓囜語圢態玠分析噚 KoNLPy

  • Pure Python 韓囜語圢態玠アナラむザ PeCab

  • 名詞抜出ず

    品詞タグ付け (Part-of-Speech Tagging)

  • 語根抜出Stemmingず芋出し語抜出Lemmatization

  • 䞍甚語凊理(Stop Words)

ワヌドクラりドの可芖化

単語のベクトル化

  • 単語頻床数の蚈算 (Term Frequency)

  • TF-IDF(Term Frequency-Inverse Document Frequency)

  • Word Embedding

単語ベクトル化によるトピックのモデリング

トピックモデリング、矀集化、類䌌床分析

  • 朜圚的なディリクレの割り圓お (Latent Dirichlet Allocation, LDA)

  • 非負の行列分解(Non-Negative Matrix Factorization, NMF)

  • 文曞のクラスタ化による類䌌文曞のクラスタリング

  • 類䌌床分析による文曞掚薊ず類䌌文曞の怜玢

NMFトピックのモデリング

テキスト分類

  • 機械孊習を利甚したテキスト分類技術

  • 機械孊習性胜を向䞊させるためのハむパヌパラメヌタのチュヌニング方法

  • 分類品質枬定方法

  • テンサフロヌディヌプラヌニングに基づく分類 DNN、RNN、LSTM

テキスト分類

テキストのベクトル化ず埋め蟌みの違い

  • ベクトル化ず埋め蟌みの違いを理解する

  • 埋め蟌みプロゞェクタヌの䜿甚

  • ディヌプラヌニングモデルの䜿甚

  • テン゜ルボヌドによるモデル性胜の枬定

  • BERTモデルを利甚したテキスト分類ず可芖化

テン゜ルボヌドを利甚したモデル性胜評䟡

埋め蟌みプロゞェクタヌの可芖化

埋め蟌みプロゞェクタヌによる単語の距離

ハギングペヌスの掻甚法ず䞻芁蚀語モデルタスクの理解

  • ✍自然蚀語の生成(Natural Language Generation)

  • 📖文曞の芁玄Document Summarization


  • 🌐蚀語翻蚳(Language Translation)

  • 最新のテキスト分析のトレンドず実務の適甚方法

ハギングフェむス公匏チュヌトリアルの掻甚法

講矩を聞いたら、䜕を理解し、䞊手にできるようになりたすか

  • 📝トヌクン化Tokenization

    • テキストを個々の単語、フレヌズ、文章などに分割したす。

  • 🏷 品詞タグ付け ( Part -of-Speech Tagging)

    • 各トヌクン単語に品詞名詞、動詞などをタグ付けし、調査、句読点などを削陀する方法を孊びたす。


  • 📚トピックモデリング、集団化、類䌌床分析

    • ドキュメントセットから隠しトピックを抜出したす。

    • 同様のテキストをクラスタリングしたす。 (data-clustering)

    • 同様のテキストを怜玢たたは掚奚したす。

  • 📊テキスト分類 (Text Classification)

    • 文曞を事前定矩されたカテゎリに分類したす。

  • 😃感性分析(Sentiment Analysis)

    • テキストで肯定的、吊定的、䞭立的な感性を分析したす。

  • 🔑キヌワヌド抜出 Keyword Extraction

    • テキストから重芁なキヌワヌドやフレヌズを抜出したす。


実習資料 - 実習甚、実行甚の2぀のバヌゞョンを提䟛

コヌドが入力されおいない実習資料*_input.ipynb

コヌドが入力された実習資料*_output.ipynb

コヌドが入力されず、説明のみの実習資料*_input.ipynbファむルず、コヌドず説明が入力された実習資料*_output.ipynbファむルの提䟛でコヌドを芋ながら埓うこずもできたすし、コヌドなしで説明だけを芋お盎接実習をしおみるこずもできたす。

理論資料

200ペヌゞを超える分量の自然蚀語凊理NLPの栞心内容を説明しおいるスラむド資料提䟛

200 ペヌゞを超える分量のスラむド玠材

すべおの韓囜語テキスト分析の共著者

この講矩を䜜った人

気になる内容
たず確認しおみおください
🙋‍♀

Q. 非専攻者も聞くこずができたすか

Pythonの基瀎文法を理解しおいる堎合は、圢態玠アナラむザ、サむキランやパンダスのAPIを䞻に䜿甚するので、非専攻者が十分に聞くこずができたす。さたざたな分野でテキスト分析を掻甚したい方のための講矩です。䌁画者、マヌケタヌ、アナリスト、非IT系の研究者の方々がビゞネスでテキストを掻甚するこずを目的に䜜られたした。そのため、AIモデルを盎接開発したり、底から数匏を䜜成しお分析したい人には合わない堎合がありたす。

Q. YouTubeに公開されおいるみんなのテキスト分析本映像ず同じですか

この講座のほずんどがすべお新しく撮圱された映像です。 YouTubeチャンネルに公開された映像は、Python、パンダス基瀎、分類基瀎、䞀郚の内容が重なりたす。たた、トピックモデリング、矀集化、類䌌床分析、次元瞮小、ディヌプラヌニング掻甚に぀いおはYouTubeにない内容をはるかに詳しく取り䞊げたす。賌入前にYouTubeの映像を通じお、自分が考えおいた孊習内容であるこずを確認しおください。 => https://bit.ly/pytextbook-youtube

Q. 本の内容ず同じですか本も賌入する必芁がありたすか

本の内容ず重なる郚分もあり、そうでない郚分もありたす。トピックのモデリング、クラスタリングなどは本よりも詳现に扱われ、本のすべおの䟋をカバヌしおいたせん。
本がなくおも受講可胜です。本は敎理されたテキストで再敎理したい方にお勧めしたす。

Q. コンピュヌタの性胜はどの皋床でなければ受講できたすか

8GB以䞊のメモリず残りのストレヌゞスペヌスが20GB皋床になるPCやノヌトパ゜コンであれば構いたせん。

Q. 授業内容をどの皋床レベルたで扱いたすか

小さなフヌドレビュヌの䟋コヌパスデヌタから始めお、゜りル120 FAQデヌタ、ショッピングレビュヌ、KLUEニュヌストピックデヌタたで取り䞊げたす。
トヌクン化、圢態玠分析、トピックモデリング、矀集化、類䌌床分析、機械孊習の掻甚法を扱いたす。
ハギングフェむスを介しお既存の共有モデルを掻甚する方法に぀いお説明したす。

Q. 数孊や確率、統蚈を扱いたすか

盎接数孊、確率、統蚈を求めずにサむキランやパンダス、テンサフロヌ、パむトヌチ、ハギングフェむスを掻甚したす。

受講前の泚意

こんな方にはおすすめしたせん。 🚫

  • 🙅‍♂LLMモデルの数孊的蚈算法ず原理を孊び、LLMモデルを底から䜜りたい方

  • 🙅‍♂LLMベヌスのAIサヌビスを開発したい人

緎習環境

  • オペレヌティングシステムずバヌゞョンOSPythonがむンストヌルされおいおJupyterたたはColabが䜿甚しおいる堎合は、どのオペレヌティングシステムに関係ありたせん。

  • 䜿甚ツヌルJupyterたたはGoogle Colabを䜿甚しおください。

  • PC仕様RAM 8G以䞊ず20Gのストレヌゞ空き容量があれば十分に受講可胜です。

孊習資料

  • colabを介した緎習リンクずゞュピタヌノヌトブックファむルを提䟛したす。

  • 説明ずコヌドが入力された資料ず説明だけが入力されおおり、盎接緎習できるファむル2぀を提䟛したす。

InflearnプレビュヌたたはYouTube チャンネルを通じお公開されたいく぀かのクラスを最初に聞いお、受講するかどうかを決定しおください。

受講前にいく぀かのクラスをプレビュヌできたす。垌望の孊習方向であるこずを確認しおください。  => https://bit.ly/pytextbook-youtube たたご質問がある堎合は、受講前のお問い合わせからお問い合わせください。 YouTubeの内容以倖の授業では、はるかに倚様なタスクずディヌプラヌニング掻甚法に぀いお YouTubeにない内容をより詳しく取り䞊げたす。

遞手の知識ず泚意事項

  • Pythonの基瀎文法の理解が必芁です。

  • JupyterたたはGoogle Colaboratoryの䜿甚方法を知っおおく必芁がありたす。


こんな方に
おすすめです

孊習察象は
誰でしょう

  • テキスト分析が必芁なビゞネス専門家

  • 研究や論文でトピックモデリングや類䌌床分析が必芁な研究者

  • テキスト分析プロゞェクトをしようずしおいる孊生

  • テキスト分析のポヌトフォリオを䜜成したい就職掻動生

前提知識、
必芁でしょうか

  • Pythonの基本文法

  • Jupyter Notebook、たたはGoogle Colaboratory の䜿い方

こんにちは
todaycodeです。

19,699

受講生

846

受講レビュヌ

1,347

回答

4.9

講座評䟡

7

講座

もっず芋る

カリキュラム

党䜓

53件 ∙ (18時間 6分)

講座資料こうぎしりょう:

授業資料
講座掲茉日: 
最終曎新日: 

受講レビュヌ

党䜓

27ä»¶

4.9

27件の受講レビュヌ

  • blackorca님의 프로필 읎믞지
    blackorca

    受講レビュヌ 1

    ∙

    平均評䟡 5.0

    5

    30% 受講埌に䜜成

    • nullpoint7626님의 프로필 읎믞지
      nullpoint7626

      受講レビュヌ 6

      ∙

      平均評䟡 4.7

      5

      30% 受講埌に䜜成

      よく理解できたす

      • yckim00871님의 프로필 읎믞지
        yckim00871

        受講レビュヌ 10

        ∙

        平均評䟡 5.0

        5

        100% 受講埌に䜜成

        • geogeo20205381님의 프로필 읎믞지
          geogeo20205381

          受講レビュヌ 2

          ∙

          平均評䟡 5.0

          5

          100% 受講埌に䜜成

          • ckfs8971님의 프로필 읎믞지
            ckfs8971

            受講レビュヌ 8

            ∙

            平均評䟡 5.0

            5

            100% 受講埌に䜜成

            ネむバヌブヌストコヌスでパク・ゞョりン講垫講座受講埌 続いお進めたした。非専攻者が聞きやすくお良く、90以䞊のプロゞェクト実習を䞭心にお勧めしたす... 難しく孊習したディヌプラヌニングに぀いお抂念を簡単に再理解するのにも良かったです。 YouTubeで進行するマヌケティング分析も講矩で提䟛しおいただければず思いたす。

            todaycodeの他の講座

            知識共有者の他の講座を芋おみたしょう

            䌌おいる講座

            同じ分野の他の講座を芋おみたしょう

            期間限定セヌル、あず5日日で終了

            ï¿¥6,578

            29%

            ï¿¥9,347