์๋ ํ์ธ์. ์ธ์ฌ์ด์ ์ ๋๋ค. ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํฉ๋๋ค.
https://incizor.com/INTRO
Courses
Reviews
- Introduction to Python Text Analysis - From Data Collection to Analysis
- Introduction to Python Text Analysis - From Data Collection to Analysis
- Introduction to Python Text Analysis - From Data Collection to Analysis
- Introduction to Python Text Analysis - From Data Collection to Analysis
- Introduction to Python Text Analysis - From Data Collection to Analysis
Posts
Q&A
jpype ์ค์น๊ด๋ จ
์๋ ํ์ธ์, ์ธ์ฌ์ด์ ์ ๋๋ค.์ ํฌ์ชฝ์์ ํ ์คํธ ํด๋ณธ ๊ฒฐ๊ณผ,pip install konlpy๋ก ์ค์น์์ ์๋์ผ๋ก ์ต์ jpype1๋ฅผ ์ค์นํ๋ ๋ชจ์ต์ ํ์ธํ์์ต๋๋ค.(์๋์ฐ ํ๊ฒฝ์์ conda 4.13, python 3.8๋ก ํ ์คํธํด๋ณด์์ต๋๋ค) ๋ง์ผ ์ง๊ธ ์ํฉ์์ konlpy ๋ผ์ด๋ธ๋ฌ๋ฆฌ import ๋ฐ Kkma๋ Hannanum, Okt ๋ฑ(Mecab์ ์ถ๊ฐ ์ค์น๊ฐ ํ์ํ๋ ์ค๋ช ์ ์ฐธ๊ณ ๋ฐ๋๋๋ค) ๊ธฐ๋ณธ ํํ์ ๋ถ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ด์ฉ์ด ๊ฐ๋ฅํ๋ค๋ฉด,์๋ AI ๋ต๋ณ๊ณผ๋ ๋ฌด๊ดํ๊ฒ ๊ทธ๋๋ก ๊ฐ์ ์์ฒญํ์ฌ๋ ์งํ์ ๋ฌธ์ ์์ ๊ฒ์ ๋๋ค. ์๋์ ๋งํฌ๋ konlpy์์ ์ ๊ณตํ๋ documentation ์ผ๋ก,๋ด์ฉ ์ฐธ๊ณ ํ์์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌํ ์คํธํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค.https://konlpy.org/ko/latest/api/konlpy.tag/ ์ถ๊ฐ๋ก ๊ถ๊ธํ์ ์ฌํญ์ด๋ ์ด์๊ฐ ์์ ์ ์ธ์ ๋ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. (์ฐธ๊ณ ๋ก ํ๊ธฐ ๋งํฌ ํ์ธํ์์ผ๋ฉฐ, ํด๋น ๋ด์ฉ์ ์ค์น๊ฐ ์ ๋์์ผ๋ ์ฃผํผํฐ๋ ธํธ๋ถ ๋ฐ ์๋์ฝ๋ค๋ฅผ ์์ ํ ์ข ๋ฃํ ๋ค์์ผ๋ผ๋ ๋ฉ์ธ์ง์์ต๋๋ค. ํ๋ฒ ์ข ๋ฃํ ๋ค์ ์คํํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค)
- 0
- 2
- 1.7K
Q&A
Konlpy ์ค์น ํ์ด์ง์์ jpype ์ค์น ๋งํฌ
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค. ์ต๊ทผ ์ฃผ์ ๋์ผ ๋ฌธ์์ ๋ต๋ณ ๊ณต์ ๋๋ ธ์ผ๋ ํ์ธํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 336
Q&A
Konlpy ์ค์น
์๋ ํ์ธ์, ์ธ์ฌ์ด์ ์ ๋๋ค.๋ง์ ์ฃผ์ ๋๋ก ๋งํฌ๊ฐ ์ ์์๋ ํ์ง ์๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค. ํ๊ฒฝ์ ๋ง์ถฐ, ํ๊ธฐ์ ๋ช ๋ น์ด ์ค ํ๋๋ฅผ ๊ณจ๋ผ jpype ์ค์น ์๋ํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค.conda:conda install -c conda-forge jpype1pip:pip install JPype1 # ํน์ ์๋์ ์๋ pip install git+https://github.com/jpype-project/jpype.git์ถ์ฒ : https://jpype.readthedocs.io/en/latest/install.html ์ถ๊ฐ๋ก ๋ฌธ์ ์ฌํญ ๋ฐ ์ด์๊ฐ ์์ ์์ธ์ ๋ ์ง๋ฌธ ๋จ๊ธฐ์๊ธฐ๋ฐ๋๋๋ค.๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 909
Q&A
๋งฅ os์์ ํฐํธ ๊ฒฝ๋ก ์ง์ *์ฝ๋ฉ ์ฌ์ฉ
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค. ๋ฌธ์ ๋ต๋ณ๋๋ฆฌ๊ฒ ์ต๋๋ค. ๋จผ์ colab์ ๊ฒฝ์ฐ, ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ ํ๊ฒฝ์ผ๋ก ๋ก์ปฌ ์์ ํฐํธ ํ์ผ์ ์ด์ฉํ๊ธฐ ์ด๋ ต์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์๋์ ๋ฐฉ๋ฒ์ค ํ๋๋ฅผ ์ ์ ํ์ฌ ์๋ํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค. 1) ํฐํธ ํ์ผ์ ์ง์ ๋๋ผ์ด๋ธ์ ์ ๋ก๋, ์ดํ ๋๋ผ์ด๋ธ ๋ง์ดํธํ์ฌ ๊ฒฝ๋ก ์ง์ 2) colab ํ๊ฒฝ ์์ฒด์ ํ๊ธ ํฐํธ ๋ค์ด๋ก๋ ๋ฐ ํด๋น ํฐํธ ์ค์ 2๋ฒ ๋ฐฉ๋ฒ์ ๋ํ, ์ฐธ๊ณ ํ ๋งํ ํฌ์คํธ๋ฅผ ๊ณต์ ๋๋ฆฌ๋ํ์ธ ํ ์๋ํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค.(matplotlib ๋ชจ๋ ๊ด๋ จ ๋ด์ฉ๋ค๋ ์์ผ๋, ๊ธฐ๋ณธ์ ์ผ๋ก ์ค๋ฅ์ ์์ธ์ด ๋์ผํ๊ธฐ์ ํจ๊ป ๊ณต์ ๋๋ฆฝ๋๋ค) ๊ตฌ๊ธ ์ฝ๋ฉ(colab) ํ๊ธ ๊นจ์ง ํ์ ํด๊ฒฐ๋ฐฉ๋ฒhttps://teddylee777.github.io/colab/colab-korean/ Colab) Wordcloud ํ๊ธ์ด ๋ณด์ด์ง ์์ ๋, ์๋ํด๋ผ์ฐ๋ ๋ง๋ค๊ธฐ, ์ฃผํผํฐ ๋ ธํธ๋ถ, Rํ๋ก๊ทธ๋จ KoNLP ์ค์น ์คํจ. ์๋ ํด๋ผ์ฐ๋ ์ ์ฅํ๋ ์ฝ๋https://summerorange.tistory.com/entry/Colab-Wordcloud-%ED%95%9C%EA%B8%80%EC%9D%B4-%EB%B3%B4%EC%9D%B4%EC%A7%80-%EC%95%8A%EC%9D%84-%EB%95%8C-%EC%9B%8C%EB%93%9C%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EC%A3%BC%ED%94%BC%ED%84%B0-%EB%85%B8%ED%8A%B8%EB%B6%81-R%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-KoNLP-%EC%84%A4%EC%B9%98-%EC%8B%A4%ED%8C%A8%EC%8B%9C-%EC%9B%8C%EB%93%9C-%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9C-%EB%A7%8C%EB%93%A4%EA%B3%A0-%EA%B7%B8%EB%A6%BC-%EC%A0%80%EC%9E%A5%ED%95%98%EB%8A%94-%EC%BD%94%EB%93%9C ๊ทธ์ธ ์ด์๊ฐ ์์ ์์ธ์ ๋ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 1.2K
Q&A
Re. Konlpy ์ค์น์ค๋ฅ(Okt ์ค๋ฅ)
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค. ๋จผ์ ์ ํฌ์ชฝ์์๋ ์ค๋ฅ ์ฌํ์ ์๋ํ์์ผ๋ ์ ๋๋ก ์ด๋ค์ง์ง ์์์ต๋๋ค.์ด๋ก์ธํด ์ ํํ ๋ต๋ณ ๋๋ฆฌ๋๋ฐ ํ๊ณ๊ฐ ์๋ ์ ์ํด ๋ถํ๋๋ฆฌ๋ฉฐ,์ ํฌ์ชฝ์์๋ ์ง์์ ์ผ๋ก ํด๊ฒฐ์ฑ ์ ๊ฐ๊ตฌํด๋ณด๊ฒ ์ต๋๋ค. ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก๋ํ์ด์ฌ ๋ฒ์ ๋ณ๊ฒฝ(+JPype1 ๋ณ๊ฒฝ) ๋ฐ, ์๋ฐ ๋ฒ์ ๋ณ๊ฒฝ ์๋๋ฅผ ์ถ์ฒ๋๋ฆฌ๊ฒ ์ต๋๋ค. Java 8(1.8) ํน์ 11 ๋ฒ์ ๋์, ํ์ด์ฌ 3.8 ์ธ์ 3.6~3.7๋ก์๋ ์๋ ๋ถํ๋๋ฆฌ๊ฒ ์ต๋๋ค. java 8 ์ ๊ฒฝ์ฐ oracle ํํ์ด์ง์์ ํ๋ณดํ๊ธฐ ์ด๋ ค์ธ ์ ์์ต๋๋ค(๋ก๊ทธ์ธ ์์ ์งํ ํ์).๋์ ์คํ์์ค๋ก์ openJDK๊ฐ ์กด์ฌํ๊ธฐ์๋ค์ด๋ก๋ ๋ฐ์ ์ ์๋ ๋งํฌ๋ฅผ ๊ณต์ ๋๋ฆฌ๊ฒ ์ต๋๋ค. https://github.com/ojdkbuild/ojdkbuild ์ ํฌ๊ฐ ๋ฒ์ ๋ณ๊ฒฝ ์๋ํ์ ๋ ์ ์ฐจ๋ ํ๊ธฐ์ ๊ฐ์ต๋๋ค.1) ๊ธฐ์กด ์๋ฐ ์ ๊ฑฐ ๋ฐ ํ๊ฒฝ๋ณ์ ์์์๋ ์ ๊ฑฐ2) ์๊ธฐ ์ฌ์ดํธ์์ java-1.8.0-openjdk-1.8.0.332-1.b09.ojdkbuild.windows.x86_64.zip (sha256) ๋ค์ด๋ก๋3) c:\program Files\java\java-1.8.0 ์ผ๋ก ์ค์ ํ์ฌ ๋ด์ฉ ์์ถ ํด์ (์ฌ์ง)4) ํ๊ฒฝ๋ณ์ ์ค์ (์ฌ์ง)(์ฌ์ง)(path ํ๊ฒฝ ๋ณ์์ ๊ฒฝ์ฐ ์๋ ๋์ค "%JAVA_HOME%\bin", "%JAVA_HOME%\jre\bin" ์ฐธ๊ณ )5) ๋ฒ์ ํ์ธ(์ฌ์ง)(java --version ์ด ์๋ java -version ์ผ๋ก ์ ๋ ฅ)ํ์ด์ฌ ๋ฒ์ ๋ณ๊ฒฝ์์๋ JPype๋ ๋ฒ์ ์ ๋ง๊ฒ ์ฌ์ค์น๊ฐ ํ์ํ์ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค. ๋ง์ง๋ง์ผ๋ก ์์คํ ์ ๋ณด์์ ์ปดํจํฐ ์ฃผ์ ์คํ ๋ฐ os ์ ๋ณด(windows ๋ฒ์ ๋ฐ ๋นํธ) ๊ณต์ ๋ถํ๋๋ฆฌ๊ณ ,ํด๋น ์ ๋ณด ๊ธฐ๋ฐ์ผ๋ก ์ค๋ฅ ์ฌํ ์๋ํด๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 1.5K
Q&A
Konlpy ์ค์น ์ค๋ฅ
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค. ๋จผ์ ํด๋น ์ค๋ฅ๋ ํด๋น ํจํค์ง๊ฐ ์ ํจํ์ง ์๊ธฐ์ ๋ฐ์ํ ์ค๋ฅ๋ก, konlpy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ okt java ํจํค์ง๋ฅผ ๋ชป์ฐพ๊ณ ์๊ธฐ์ ๋ฐ์ํ ์ค๋ฅ๋ก ๋ณด์ ๋๋ค. ์ด๋ ์ฌ๋ฌ ์์ธ์ด ์์ ์ ์์ผ๋ฉฐ,๋ง์ ์ฃผ์ ๋ด์ฉ ๋ฐ ์คํฌ๋ฆฐ์ท์ ๊ทผ๊ฑฐ๋ก ํ ๋'์ค์ ์ค์น๋ konlpy ๋ฐ ํ์ด์ฌ, jupyter ํ๊ฒฝ ๊ฒฝ๋ก ์์ดํจ'์ด ์ฃผ ์์ธ์ผ๋ก ์ถ์ธก๋ฉ๋๋ค. ํ์ด์ฌ, java, JPype, jupyter๋ฅผ ๋ชจ๋ ์ ๊ฑฐํ์ ํ์ฌ์ค์น ์์ ์งํ์ ์ถ์ฒ๋๋ฆฌ๊ฒ ์ต๋๋ค. ์๋์ ํ๋ก์ธ์ค๋ ๋ง์ ์ฃผ์ ๋ด์ฉ ๊ธฐ๋ฐ, ์์ ์๋์ฐ ์๋ฒ๋ฅผ ๊ตฌ์ถํ์ฌ ์ค์น ๋ฐ ํ ์คํธ๋ฅผ ์งํํ ๋ด์ฉ์ ๋๋ค.์ ํฌ์ชฝ์์ ์ค์น ์์ ์งํํ์ ๋ ๋ฌธ์ ์์ด ์ ์์๋ํ๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค.(ํ ์คํธ ํ๊ฒฝ์ ์๋์ฐ 2022 ์๋ฒ๋ก ์ค์ ํ๊ฒฝ๊ณผ ์์ดํ ์ ์์ต๋๋ค) 1) python ์ค์น : 3.8.9 ๋ฒ์ ์ผ๋ก, python.org์ ์ ์ํ์ฌ ์ธ์คํจ๋ฌ๋ก ์ค์นํ์์ต๋๋ค.https://www.python.org/downloads/release/python-389/1-1) python ์ค์น ํ์ธ : cmd ์์์ python --version ์ ๋ ฅํ์์ ์, python 3.8.9๊ฐ ๋์ค๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค. 2) java ์ค์น : java 19.0.2๋ฅผ ๊ฒ์ํ์ฌ, oracle ์ฌ์ดํธ์์ ์ค์นํ์ผ ๋ค์ด๋ก๋ ๋ฐ์ ์ค์นํ์์ต๋๋ค. ์๋์ฐ 64bit ๋ฒ์ ์ผ๋ก ์ค์นํ์์ต๋๋ค.https://www.oracle.com/java/technologies/javase/jdk19-archive-downloads.html2-1) java ์ค์น ํ์ธ : cmd ์์์ java --version ์ ๋ ฅํ์์ ์, ์๋์ ๋ด์ฉ์ด ์ถ๋ ฅ๋๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค.java 19.0.2 2023-01-17Java(TM) SE Runtime Environment (build 19.0.2+7-44)Java HotSpot(TM) 64-Bit Server VM (build 19.0.2+7-44, mixed mode, sharing)2-2) ์์คํ ํ๊ฒฝ ๋ณ์ ์ค์ : ์๋์ ๊ฐ์ด ์ค์ ํ์์ต๋๋คJAVA_HOME ์ค์ : C:\Program Files\Java\jdk-19Path ๋ด์ bin ์ค์ : %JAVA_HOME%\bin 3) JPype ์ค์น : ์๋ ๋งํฌ์์ JPype1โ1.1.2โcp38โcp38โwin_amd64.whl ํ์ผ์ ๋ค์ด๋ก๋ ๋ฐ์์ต๋๋ค.https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype3-1) JPype1 ์ค์น : ์๋์ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ๊ฐ์ต๋๋ค.3-1-1) cmd ์คํ3-1-2) cd ๋ช ๋ น์ด๋ฅผ ํตํด JPype ํ์ผ์ด ์๋ ์์น๋ก ์ด๋3-1-3) ์๋ ๋ช ๋ น์ด ์คํpip install JPype1โ1.1.2โcp38โcp38โwin_amd64.whl 4) konlpy ์ค์น : cmd ์์์, pip install konlpy๋ก ์ค์นํ์์ต๋๋ค.4-1) konlpy ์ค์น ํ์ธ : ์๋์ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ๊ฐ์ต๋๋ค.4-1-1) cmd ์คํ4-1-2) python ์ ๋ ฅ4-1-3) from konlpy.tag import Okt ์ ๋ ฅ4-1-4) okt = Okt() ์ ๋ ฅ4-1-5) okt.pos("์ค์น ํ ์คํธ ์งํ์ค์ ๋๋ค") ์ ๋ ฅ4-1-6) ๊ฒฐ๊ณผ ํ์ธ(์ฌ์ง)5) jupyter ์ค์น : cmd ์์์, pip install jupyter ๋ก ์ค์นํ์์ต๋๋ค. 6) jupyter ์ ์ ๋ฐ ํ ์คํธ ์งํ : cmd ์์์, jupyter notebook ๋ช ๋ น์ด ์ ๋ ฅํ, ์ฐ๊ฒฐ๋๋ ์ธํฐ๋ท ์ฐฝ์์ ์งํํ์ต๋๋ค. ๋ํ ์์์ ipynb ํ์ผ ์์ฑ ํ, 4๋ฒ์์ ์งํํ ์คํฌ๋ฆฝํธ๋ฅผ ์ ๋ ฅํ์ฌ ์คํํด๋ณด์์ต๋๋ค.(์ฌ์ง) ๊ทธ์ธ ์ฐธ๊ณ ํ ๋งํ ๋ธ๋ก๊ทธ ํฌ์คํธ๋ค์ ๊ณต์ ๋๋ฆฌ๋ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค. ํ์ด์ฌ, java, jpype1 ์ ๊ฑฐ ๋ฐ konlpy ์ฌ์ค์นhttps://velog.io/@soo-im/konlpy-%EC%84%A4%EC%B9%98-%EC%97%90%EB%9F%AC-%ED%95%B4%EA%B2%B0%EC%B1%85-%EC%95%84%EB%82%98%EC%BD%98%EB%8B%A4-JPYPE AttributeError: Java package 'kr.lucypark.okt' is not valid ์ด์https://github.com/konlpy/konlpy/issues/401 Java package 'kr.lucypark.kkma' is not valid ์ค๋ฅ #324https://github.com/konlpy/konlpy/issues/324 ์ฌ์ค์น ์๋, ํน์ ๋ธ๋ก๊ทธ ์ฐธ์กฐํ์ฌ ๋ค๋ฅธ ๋ฐฉ์์ ๋ํด ์๋ํด๋ณด์๊ณ ,๊ทธ๋๋ ํด๊ฒฐ์ด ์๋ ์์ ์ถ๊ฐ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 3.7K
Q&A
tfidf ๊ด๋ จ
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค. ๋ง์ ์ฃผ์ ๋ด์ฉ์ ๋ํด, '๊ธฐ์กด ์ ํฌ๊ฐ ์ ๊ณต๋๋ฆฐ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ ๋๋ ๋ฌธ์ ์์ด ์๋ํ์์ผ๋,์ ๊ท ์์งํ์ ๋ด์ค ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐํ์ ๋๋ ์์ ๊ฐ์ ์๋ฌ๊ฐ ๋ฐ์ํ๋ค' ๋ผ๊ณ ์ดํดํ์์ต๋๋ค. ์๋ฌ ๋ด์ฉ์ ๋ฐ์ดํฐ ์ธ์ฝ๋ฉ ํฌ๋งท์ ์ฐจ์ด๋ก ๋ฐ์ํ ์ค๋ฅ๋ก,๋ฐ์ดํฐ ์์ 'utf-8' ํฌ๋งท์ด ์๋ ํ ์คํธ ๋ฐ์ดํฐ๊ฐ ์๊ธฐ์ ๋ฐ์ํ์์ต๋๋ค. ์ ๊ท ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ ๋ utf-8๋ก ์ ์ฅํ์๋ ์ง ํ์ธํด ๋ณด์๊ธฐ ๋ฐ๋ผ๋ฉฐ,ํน์ pandas๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ฝ์ด ๋ค์ผ ๋ encoding="utf-8"๋ก ์ฝ์ด๋ค์ด๋ ์๋๋ฅผ ํด๋ณด์๋ ๊ฒ ๋ํ ์ถ์ฒ ๋๋ฆฝ๋๋ค. ๋ํ ์๋ ๋์ผ ์ด์ ๊ด๋ จ ๋ธ๋ก๊ทธ ํฌ์คํธ๋ฅผ ํจ๊ป ๊ณต์ ๋๋ฆฌ๋ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค.https://gmnam.tistory.com/291?category=899950 ๊ทธ์ธ์ ์ด์๊ฐ ์์ ์,์ธ์ ๋ ์ง๋ฌธ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 481
Q&A
TF-IDF ์ง๋ฌธ์ ๋๋ค.
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค.๋ฌธ์์ ๋ต๋ณ๋๋ฆฌ๊ฒ ์ต๋๋ค.1)๋จผ์ ์ ํฌ๊ฐ ์ฝ๋ ํ์ผ์ ๋ค์ด๋ก๋ํ์ฌ ํ์ธํ์์ ๋๋ df๋ฅผ ๊ตฌํ๋ ์ฝ๋๊ฐ ํฌํจ๋์ด ์์์ต๋๋ค.์๋ ์คํฌ๋ฆฐ์ท์ ์ฐธ๊ณ ํ์ฌ ์ ๋ ฅํ์๊ฑฐ๋, ๋ค์ ํ์ผ์ ๋ค์ด๋ก๋ํ์ฌ ํ์ธํด๋ณด์๊ธฐ ๋ฐ๋๋๋ค.(์ฌ์ง)2)๋จผ์ np๋ numpy ๋ชจ๋์ ์ฝ์ด์ ๋๋ค.(import numpy as np ์ ์๋ฏธ๋ numpy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ np๋ผ๋ ๋ช ์นญ์ผ๋ก ์ฌ์ฉํ๋ค๋ ์๋ฏธ์ ๋๋ค)๊ทธ๋ฆฌ๊ณ numpy์์ ์ ๊ณตํด์ฃผ๋ numpy.log(np.log) ํจ์๋, numpy array(ํน์ pandas series)์์ ๊ฐ๋ค์ log๋ฅผ ์ ์ฉํ๋ ๊ธฐ๋ฅ์ผ๋ก, ๊ฐ์ ์ค๋ช ์์ ๋ค์ผ์ ๊ฒ ์ฒ๋ผ ๋ณด์ ์ ์ํด ๋ฃ์ด์ฃผ์์ต๋๋ค.numpy.log()๋ ๋ฐ์ด ์์ฐ์์์ธ ๋ก๊ทธ๋ก์ ์ ์ฉ๋๋ ํจ์์ด๋ฉฐ, ๊ฐ๊ฐ ๋ฐ์ด 2๊ฑฐ๋ 10(์์ฉ๋ก๊ทธ)์ธ ์ผ์ด์ค๋ฅผ ์ ์ฉํ๊ณ ์ถ์ผ์๋ค๋ฉด numpy.log2(), numpy.log10()์ ์ ์ฉํ์๋ฉด ๋๊ฒ ์ต๋๋ค.๊ทธ๋ฆฌ๊ณ +1์ ๊ฐ์ ์ ์ฉํ ์ด์ ๋ ์ฃผ๋ก ๊ณ์ฐ์ ์ค๋ฅ๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํจ์ผ๋ก ์๋์ ๊ฐ์ต๋๋ค.2-1) 0์ผ๋ก ๋๋๊ฒ ๋์ด ๋ฐ์ํ๋ zero division error๋ฅผ ๋ฐฉ์ง ํ๊ธฐ ์ํจ2-2) ํฅํ tf*idf ๊ณ์ฐ ์ idf๊ฐ 0์ด๋์ด, tf์ ์ ๋ณด๊ฐ ๋๋ฝํ ๊ฐ๋ฅ์ฑ์ ๋ฐฉ์งํ๊ธฐ ์ํจ์๊ธฐ์ ๋ณด์ ๋ฐฉ์(๊ฐ ๊ฐ์ +1, ๋ฐ์ด ์์ฐ์์์ธ ๋ก๊ทธ ์ ์ฉ)์ ๋ฐ๋ก ์ ๋ต์ด ์ ํด์ ธ์์ง ์์ ๋ฐ,์ํฉ์ ๋ง์ถฐ ์ ์ฉํ์๋ฉด ๋๊ฒ ์ต๋๋ค.์ถ๊ฐ๋ก ๊ถ๊ธํ์ ์ ์์ผ๋ฉด ์ธ์ ๋ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.๊ฐ์ฌํฉ๋๋ค.์ฐธ๊ณ ํฌ์คํธnumpy loghttps://cosmosproject.tistory.com/429tf-idfhttps://yngie-c.github.io/nlp/2020/05/16/nlp_tf-idf/
- 0
- 1
- 479
Q&A
ํ ํฝ๋ชจ๋ธ๋ง ๋ ์ง ๊ด๋ จ ์ค๋ฅ
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค.๋จผ์ ๋งฅ์์ ํ๊ธํฐํธ๊ฐ ๊นจ์ง๋ ์ผ์ด์ค๋ ์๋์ ํฌ์คํธ๋ฅผ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค.https://wannabe00.tistory.com/entry/Mac%EC%97%90%EC%84%9C-Matplotlib-%EC%82%AC%EC%9A%A9-%EC%8B%9C-%ED%95%9C%EA%B8%80-%EA%B9%A8%EC%A7%90-%ED%95%B4%EA%B2%B0์ด์ ๊ณต์ ๋๋ฆฐ ํ ํฝ ๋ชจ๋ธ๋ง ์ฝ๋์, ์๋ ์ฒ๋ผ ํฐํธ๋ฅผ ๋ฑ๋กํ์๋ฉด ๋๊ฒ ์ต๋๋ค.(์ฌ์ง)๊ทธ๋ฆฌ๊ณ ๋ณด๋ด์ฃผ์ ์คํฌ๋ฆฐ์ท์ ๋ณด๊ฑด๋ฐ,๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆด๋ ์ฌ์ฉํ ๋ฐ์ดํฐ๊ฐ 2020๋ 8์์ ๋ฐ์ดํฐ๋ก๋ง ๊ตฌ์ฑ๋ ๊ฒ ์๋๊น ์ถ์ต๋๋ค.matplotlib ๊ฐ๊ณต ์ ์ ๋ฐ์ดํฐ์ ์ ํ ๋ฒ ํ์ธํด๋ณด์๊ณ ,๊ทธ๋ผ์๋ ์ด์๊ฐ ์์ ์ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 228
Q&A
์ง๋ฌธ๋๋ฆฝ๋๋ค.
์๋ ํ์ญ๋๊น, ์ธ์ฌ์ด์ ์ ๋๋ค.๋ณด๋ด์ฃผ์ ์ฝ๋๋ฅผ ํ์ธํด๋ณธ ๊ฒฐ๊ณผ,tokenizer ํจ์์ชฝ์์ ์๋ฌ๊ฐ ๋ฐ์ํ ๊ฒ ํ์ธํ์ต๋๋ค.mecab = Mecab()์ผ๋ก Mecab ์ธ์คํด์ค๋ฅผ ์์ฑํ์ ๊ฒ์ผ๋ก ๋ณด์ด๊ธฐ์,mecab().noun(text) -> mecab.noun(text)๋ก ๋ณ๊ฒฝํ์๋ฉด ์๋ํ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.ํ๋ฒ ์๋ํด๋ณด์๊ณ ์ถ๊ฐ๋ก ์๋ฌ ๋ฐ์์ ๋ฌธ์ ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 294