Microsoft MVP(Python Developer Technologies)
โ๋ชจ๋๊ฐ ๋ฐ์ดํฐ์ ์น์ํด์ง๋ ๋ ์ด ์ค๊ธธโโ ๋ง์ดํฌ๋ก์ํํธ์จ์ด (๋งํฌ)
๋ค์ด๋ฒ ์ปค๋ฅํธ ์ฌ๋จ ๋ถ์คํธ์ฝ์ค ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ๊ฐ์ ์ค๊ณ ๋ฐ ๊ต์์
์์ธ๋ ๋น ๋ฐ์ดํฐํ์ ๊ณต์ ๋ํ, ์์ธ๋ ํ์๊ต์ก์, ์ฐ์ธ๋ DX Academy, ํ์ ๋ ABC Camp, ํ์๋ ๋ํ์, ์ ๋จ๋,
ํ๊ตญ๋ฅ๋ฅ ํํ, ์ผ์ฑSDS ๋ฉํฐ์บ ํผ์ค, ๋ฉ์์ด์ฌ์์ฒ๋ผ, ํจ์คํธ์บ ํผ์ค, ๋ชจ๋์์ฐ๊ตฌ์ ๋ฑ ๋ค์์ ๊ต์ก๊ธฐ๊ด ๋ฐ ๊ธฐ์ ๊ฐ์
๋ค์ํ ๋๋ฉ์ธ(์ ์ฝ, ํต์ , ์๋์ฐจ, ์ปค๋จธ์ค, ๊ต์ก, ์ ๋ถ๊ธฐ๊ด ๋ฑ)์ ๊ธฐ์ ๋ฐ์ดํฐ ๋ถ์
20๋ ์ด์ ๊ฒ์, ๊ด๊ณ , ๊ต์ก ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์์ ์น ๋ฐฑ์๋ ๊ฐ๋ฐ์ ๋ฐ ๋ฐ์ดํฐ ๋ถ์๊ฐ ํ์ ๊ฒฝํ
Courses
Reviews
- Getting started with Python data analysis using public data
- Finding Signals and Noise with Python Stock Data Collection and Analysis
- Getting started with Python data analysis using public data
- Finding Signals and Noise with Python Stock Data Collection and Analysis
- Learn Data Science with Kaggle Practice
Posts
Q&A
Component ์๋ ์ด๋ป๊ฒ ์ง์ ์ ํด์ผ ํ ๊น์?
์๋ ํ์ธ์! LDA๋ NMF์์ ์ต์ ์ ์ปดํฌ๋ํธ ์(ํ ํฝ์ ๊ฐ์, K)๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํด ์ง๋ฌธํด์ฃผ์ จ๋ค์. ํ ํฝ ๋ชจ๋ธ๋ง์๋ ๋น์ทํ ์ ๋์ ์งํ๋ค์ด ์์ผ๋ฉฐ, ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๊ฒ์ 'Perplexity'์ 'Coherence Score' ์ ๋๋ค.ํ์ง๋ง ๊ตฐ์ง ๋ถ์๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, ์ด ์งํ๋ค์ด ํญ์ ์ ๋ต์ ์๋ ค์ฃผ๋ ๊ฒ์ ์๋๋ฉฐ, ์ต์ข ์ ์ผ๋ก๋ ์ฌ๋์ด ์ง์ ํ ํฝ์ ํ์ง์ ๋ณด๊ณ ํ๋จํ๋ ์ ์ฑ์ ํ๊ฐ๊ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค. 1. ์ ๋์ ํ๊ฐ ์งํ (Quantitative Metrics)๊ฐ. Coherence Score (์์ง๋ ์ ์) Coherence Score๋ ์์ฑ๋ ํ ํฝ์ด ์ผ๋ง๋ ์๋ฏธ์ ์ผ๋ก ์ผ๊ด์ฑ ์๋์ง๋ฅผ ์ธก์ ํ๋ ์งํ์ ๋๋ค. ์ฆ, ํ ํ ํฝ ๋ด์ ๋ฑ์ฅํ๋ ์์ ๋จ์ด๋ค์ด ์๋ก ์ผ๋ง๋ ์ฐ๊ด์ฑ์ด ๋์์ง๋ฅผ ๊ณ์ฐํฉ๋๋ค.ํด์: ์ ์๊ฐ ๋์์๋ก ์๋ฏธ์ ์ผ๋ก ์ผ๊ด๋, ์ฌ๋์ด ํด์ํ๊ธฐ ์ข์ ํ ํฝ์ด ์์ฑ๋์์์ ์๋ฏธํฉ๋๋ค.์ฌ์ฉ๋ฒ:๋ค์ํ K ๊ฐ (์: 5, 10, 15, ..., 100)์ ๋ํด LDA/NMF ๋ชจ๋ธ์ ๊ฐ๊ฐ ํ์ต์ํต๋๋ค.๊ฐ ๋ชจ๋ธ์ ๋ํด Coherence Score๋ฅผ ๊ณ์ฐํฉ๋๋ค.K ๊ฐ์ ๋ฐ๋ฅธ Coherence Score๋ฅผ ๊ทธ๋ํ๋ก ๊ทธ๋ฆฝ๋๋ค.๊ทธ๋ํ์์ ์ ์๊ฐ ๊ฐ์ฅ ๋๊ฒ ๋ํ๋๋ ์ง์ (Peak)์ด๋, ์ ์๊ฐ ๊ธ๊ฒฉํ ๊บพ์ด๋ฉฐ ์์ ํ๋๋ ์ง์ ์ ์ต์ ์ K ํ๋ณด๋ก ์ ํํฉ๋๋ค.์ข ๋ฅ: C_v, Umass, C_uci, C_npmi ๋ฑ ์ฌ๋ฌ ๊ณ์ฐ ๋ฐฉ์์ด ์์ผ๋ฉฐ, ์ผ๋ฐ์ ์ผ๋ก C_v๊ฐ ์ฌ๋์ ํ๋จ๊ณผ ๊ฐ์ฅ ์ ์ฌํ ๊ฒฝํฅ์ ๋ณด์ฌ ๋ง์ด ์ฌ์ฉ๋ฉ๋๋ค. Python์ gensim ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์ฝ๊ฒ ๊ณ์ฐํ ์ ์์ต๋๋ค.์ค๋ฃจ์ฃ ์ค์ฝ์ด์์ ์ ์ฌ์ : ๊ตฐ์ง์ด ์ผ๋ง๋ ์ ํ์ฑ๋์๋์ง ์ธก์ ํ๋ ์ค๋ฃจ์ฃ ์ค์ฝ์ด์ฒ๋ผ, Coherence Score๋ ํ ํฝ์ด ์ผ๋ง๋ ์๋ฏธ์ ์ผ๋ก ์ ํ์ฑ๋์๋์ง ์ธก์ ํฉ๋๋ค.๋. Perplexity (ํผ์ก๋)Perplexity๋ ๋ชจ๋ธ์ด ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ผ๋ง๋ ์ ์ค๋ช ํ๋์ง๋ฅผ ๋ํ๋ด๋ ์งํ๋ก, ๋ชจ๋ธ์ด ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ์ผ๋ง๋ ์ ์์ธกํ๋์ง๋ฅผ ์ธก์ ํฉ๋๋ค.ํด์: ๊ฐ์ด ๋ฎ์์๋ก ๋ชจ๋ธ์ด ๋ฐ์ดํฐ๋ฅผ ์ ์ค๋ช (์์ธก)ํ๋ค๋ ์๋ฏธ์ ๋๋ค.์ฌ์ฉ๋ฒ:K ๊ฐ์ ๋ฐ๋ฅธ Perplexity๋ฅผ ๊ทธ๋ํ๋ก ๊ทธ๋ฆฝ๋๋ค.๊ทธ๋ํ์ ๊ธฐ์ธ๊ธฐ๊ฐ ์๋งํด์ง๋ ์ง์ (Elbow Point)์ ์ต์ ์ K ํ๋ณด๋ก ์ ํํฉ๋๋ค.์ฃผ์์ฌํญ:Perplexity๋ K๊ฐ ์ปค์ง์๋ก ๊ณ์ํด์ ๋ฎ์์ง๋ ๊ฒฝํฅ์ด ์์ต๋๋ค.์ด ๊ฒฝ์ฐ, ํ ํฝ์ด ๋๋ฌด ์ธ๋ถํ๋์ด ์ฌ๋์ด ํด์ํ๊ธฐ ์ด๋ ค์ด ์๋ง์ ํ ํฝ์ด ์์ฑ๋ ์ ์์ต๋๋ค.Perplexity๊ฐ ๋ฎ๋ค๊ณ ํด์ ๋ฐ๋์ ์ฌ๋์ด ํด์ํ๊ธฐ ์ข์ ํ ํฝ์ธ ๊ฒ์ ์๋๋๋ค. ์ต๊ทผ์๋ Perplexity๋ณด๋ค Coherence Score๋ฅผ ๋ ์ ๋ขฐํ๋ ์ถ์ธ์ ๋๋ค.์๋ณด์ฐ ํ๋กฏ๊ณผ์ ์ ์ฌ์ : ๊ตฐ์ง ๋ด ๊ฑฐ๋ฆฌ(inertia)๊ฐ ์ค์ด๋๋ ์๋ณด์ฐ ํ๋กฏ์ฒ๋ผ, Perplexity๋ ํน์ ์ง์ ์์ ๊ฐ์์จ์ด ๋ํ๋๋ 'ํ๊ฟ์น' ์ง์ ์ ์ฐพ์ต๋๋ค.2. ์ ์ฑ์ ํ๊ฐ ๋ฐฉ๋ฒ (Qualitative Evaluation)์ ๋์ ์งํ๋ ํ๋ฅญํ ๊ฐ์ด๋๋ผ์ธ์ ์ ๊ณตํ์ง๋ง, ์ต์ข ๊ฒฐ์ ์ ๊ฒฐ๊ตญ ์ฌ๋์ด ํด์ผ ํฉ๋๋ค. ํ ํฝ ๋ชจ๋ธ๋ง์ ์ฃผ๋ ๋ชฉ์ ์ '์ฌ๋์ด ์ดํดํ๊ณ ์ธ์ฌ์ดํธ๋ฅผ ์ป๋ ๊ฒ'์ด๊ธฐ ๋๋ฌธ์ ๋๋ค.๋ฐฉ๋ฒ:Coherence Score๋ Perplexity๋ฅผ ํตํด ์ฐพ์ ๋ช ๊ฐ์ K ํ๋ณด(์: K=20, 25, 30)๋ฅผ ์ ํฉ๋๋ค.๊ฐ K ๊ฐ์ผ๋ก ํ์ต๋ ๋ชจ๋ธ์ ํ ํฝ๋ณ ์์ ๋จ์ด ๋ชฉ๋ก์ ์ง์ ์ถ๋ ฅํด ๋ด ๋๋ค.์๋ ๊ธฐ์ค์ ๋ฐ๋ผ ํ ํฝ์ ํ์ง์ ํ๊ฐํฉ๋๋ค.ํด์ ๊ฐ๋ฅ์ฑ (Interpretability): ๊ฐ ํ ํฝ์ ๋จ์ด๋ค์ด ํ๋์ ์๋ฏธ ์๋ ์ฃผ์ ๋ก ๋ฌถ์ด๋๊ฐ? (์: '๋๊ตฌ', '์ถ๊ตฌ', '์ผ๊ตฌ', '์ ์' -> '์คํฌ์ธ ' ํ ํฝ)์ฐจ๋ณ์ฑ (Distinctiveness): ๊ฐ ํ ํฝ๋ค์ด ์๋ก ๋ค๋ฅธ ์ฃผ์ ๋ฅผ ๋ค๋ฃจ๊ณ ์๋๊ฐ? ์๋๋ฉด ๋น์ทํ ํ ํฝ์ด ์ค๋ณต๋๋๊ฐ?์ก์ (Junk Topics): ์๋ฏธ ์๋ ๋จ์ด(๋ถ์ฉ์ด, ํน์๋ฌธ์ ๋ฑ)๋ก๋ง ๊ตฌ์ฑ๋ ํ ํฝ์ด ์๋๊ฐ?์ต์ข ์ ํ: ์ ๋์ ์งํ๊ฐ ๊ฐ์ฅ ์ข์๋ K๊ฐ ์๋๋๋ผ๋, ์ฌ๋์ด ๋ณด๊ธฐ์ ๊ฐ์ฅ ํด์์ด ์ ๋๊ณ , ๋น์ฆ๋์ค ๋ชฉ์ ์ ๋ถํฉํ๋ ํ ํฝ๋ค์ ์์ฑํ๋ K๋ฅผ ์ต์ข ์ ์ผ๋ก ์ ํํฉ๋๋ค.์ค์ฉ์ ์ธ ์ ๊ทผ๋ฒ (Workflow)K์ ๋ฒ์ ์ค์ : ๋ถ์ํ๋ ค๋ ๋ฌธ์์ ์๊ณผ ๋๋ฉ์ธ ์ง์์ ๋ฐํ์ผ๋ก K์ ๋๋ต์ ์ธ ๋ฒ์๋ฅผ ์ค์ ํฉ๋๋ค. (์: 10๋ถํฐ 100๊น์ง 5๋จ์๋ก)์ ๋์ ์งํ ๊ณ์ฐ: ์ค์ ํ K ๋ฒ์ ๋ด์์ ๊ฐ K ๊ฐ์ ๋ํด ๋ชจ๋ธ์ ํ์ต์ํค๊ณ Coherence Score (C_v)์ Perplexity๋ฅผ ๊ณ์ฐํฉ๋๋ค.์๊ฐํ ๋ฐ ํ๋ณด ์ ์ : K ๊ฐ์ ๋ฐ๋ฅธ ๋ ์งํ๋ฅผ ๊ทธ๋ํ๋ก ๊ทธ๋ ค๋ด ๋๋ค. Coherence Score๊ฐ ๊ฐ์ฅ ๋์ ์ง์ ๊ณผ Perplexity์ ์๋ณด์ฐ ์ง์ ์ ์ค์ฌ์ผ๋ก 2~3๊ฐ์ K ํ๋ณด๋ฅผ ์ ์ ํฉ๋๋ค.์ ์ฑ์ ํ๊ฐ: ์ ์ ๋ K ํ๋ณด๋ค์ ๋ํด ๊ฐ๊ฐ ํ ํฝ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํ์ฌ ์ง์ ๋์ผ๋ก ํ์ธํ๊ณ , ๊ฐ์ฅ ํด์ ๊ฐ๋ฅํ๊ณ ์ ์ฉํ ํ ํฝ์ ์์ฑํ๋ K๋ฅผ ์ต์ข ์ ์ผ๋ก ์ ํํฉ๋๋ค.์ฆ๊ฑฐ์ด ์ฐํด ์ฃผ๋ง๋์๊ธธ ๋ฐ๋ผ๊ฒ ์ต๋๋ค.๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 17
Q&A
์ฃผ์ ์๋๋งค๋งค ํ๋ก๊ทธ๋จ ์ ์ ๊ด๋ จ ์กฐ์ธ ๋ถํ๋๋ฆฝ๋๋ค
์๋ ํ์ธ์. ๊ฐ์๋ฅผ ์๊ฐํด ์ฃผ์๊ณ ์ข์ ์ง๋ฌธ์ ๋จ๊ฒจ์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค.๋ค๋ง, ๊ฐ์ ์๊ฐ์๋ ์๋ ๊ฒ์ฒ๋ผ ์ด ๊ฐ์๋ ํฌ์ ๊ด๋ จ ๊ฐ์๊ฐ ์๋๋๋ค.์๋๋งค๋งค ๋ฑ์ ๋ํ ๋ด์ฉ๋ ๋ค๋ฃจ์ง ์์ต๋๋ค.๊ฐ์์ ๋ฌด๊ดํ๊ฒ ์ทจ๋ฏธ์ผ์ ์๋๋งค๋งค๋ฅผ ๊ตฌํํด ๋ณธ์ ์ด ์์ต๋๋ค. ๊ทธ๋ฐ๋ฐ ์๊ฐ๋ณด๋ค ์ํ๋ ์์ ๊ณผ ๊ตฌ๋งค๊ฐ๊ฒฉ์ ๋ง์ถ๋ ๊ฒ์ด ์ฝ์ง ์์๊ณ ์ด๋ฅผ ํตํด ์คํ๋ ค ์ํด๋ฅผ ๋ดค์ต๋๋ค.์ ๋ ์๋๋งค๋งค๋ณด๋ค๋ ๋ค๋ฅธ ์ผ์ ๊ด์ฌ์ด ๋ ๋ง์ ์ทจ๋ฏธ๋ก ์ ์ ์๋๋งค๋งค๋ฅผ ํด๋ณธ ๊ฒ์ ๋ง์กฑํ์ต๋๋ค.๊ทธ๋์ ์ ๊ฐ ์๋๋งค๋งค์ ๋ํ ์กฐ์ธ์ ๋๋ฆฌ๊ธฐ๋ ์ด๋ ต์ต๋๋ค.์ธํฐ๋ท ์์ ์ด๋ ์๋๋งค๋งค์ ๊ด๋ จ๋ ๊ฐ์๊ฐ ๋ง์ด ์์ต๋๋ค. ํด๋น ๊ฐ์๋ ๋ฐ์ดํฐ ๋ถ์ ๊ธฐ๋ฒ์ ์ฆ๊ถ๋ฐ์ดํฐ๋ฅผ ์์ฌ๋ก ์์๋ณด๋ ๊ฐ์์ด๊ธฐ ๋๋ฌธ์ ๋ง์กฑ์ค๋ฌ์ด ๋ต๋ณ์ ๋๋ฆฌ์ง ๋ชปํด ์ฃ์กํฉ๋๋ค.๋จ์ ์ฐํด ์ฃผ๋ง ์ฆ๊ฒ๊ฒ ๋ณด๋ด์๊ธธ ๋ฐ๋ผ๊ฒ ์ต๋๋ค.๊ฐ์ฌํฉ๋๋ค.
- 0
- 1
- 31
Q&A
ํจํค์ง ์ค์น ์๋ฌ ydata-profiling
์๋ ํ์ธ์. ydata-profiling ์ ์ถ์ํ๋ ๋๊ตฌ๋ก ๋ค์ํ EDA๋ฅผ ํ๋ฒ์ ํด์ค๋ค๋ ์ฅ์ ์ด ์์ง๋ง ํจํค์ง ์์กด์ฑ ๋ฌธ์ ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ๋ฐ์ดํธ ๋ฌธ์ ๊ฐ ์์ด ํ์ด์ฌ ๋ฒ์ ๋ฑ์ ๋ง์ถฐ ์ฃผ์ด์ผ ํ๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.์ธํ๋ฐ AI ์ธํด์ด ๋ต๋ณํด์ค๊ฒ์ฒ๋ผ ํ์ด์ฌ ๋ฒ์ ์ ๋ง์ถฐ์ค ์๋ ์์ผ๋ ๊ฐ์๋ฅผ ์ํด์๋ง ๋ฒ์ ์ ๋ง์ถ๋ค๋ฉด ๋ฒ๊ฑฐ๋ก์ธ๊ฑฐ ๊ฐ์ google colab์ ์ฌ์ฉํด์ ์ค์ต์ ์งํํ์๋ ๊ฒ์ ๊ถ์ฅ ๋๋ฆฝ๋๋ค.
- 0
- 2
- 50
Q&A
adapt() valid ํฌํจ
์๋ ํ์ธ์. ์ข์ ์ง๋ฌธ์ ์ฃผ์ จ๋ค์. ๋ง์ํด ์ฃผ์ ๊ฒ์ฒ๋ผ ์ดํ๋ฅผ ํ์ตํ ๋ valid๊น์ง ํ์ตํ๋ฉด ๋ฐ์ดํฐ ๋์๊ฐ ๋ ์๋ ์์ต๋๋ค. valid์๋ง ์๋ ๋จ์ด๊ฐ ์ฌ์ ์ ํฌํจ๋๊ฒ ๋๊ธฐ ๋๋ฌธ์ ์ ์ธํ๊ธฐ๋ ํ๋, test ๋ฐ์ดํฐ๋ ์ ์ธํ๋๊ฒ ๋ง๊ณ valid์ ๊ฒฝ์ฐ์๋ ๋ฐ์ดํฐ์ ์ ํฌ๊ธฐ๋ฅผ ๊ณ ๋ คํด์ ์ ์ธํ๊ฑฐ๋ ํฌํจํ๊ฒ ๋ฉ๋๋ค.valid๋ก ํ์ตํ์ง ๋ชปํ๋ ์ดํ๊ฐ ๋๋ฌด ๋ง๊ฒ ๋๋ฉด ๋ชจ๋ธ ์ฑ๋ฅ์ด ํจ๊ป ๋จ์ด์ง ์๋ ์์ต๋๋ค.๋ฐ์ดํฐ์ ์ด ์๊ฑฐ๋, ํ๋ จ/๊ฒ์ฆ ๋ฐ์ดํฐ ๊ฐ์ ๋จ์ด ๋ถํฌ ์ฐจ์ด๊ฐ ํด ๋, ํ๋ จ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ์ดํ๋ฅผ ํ์ตํ๊ธฐ ์ด๋ ต์ต๋๋ค. ์ด ๊ฒฝ์ฐ, ๊ฒ์ฆ ๋ฐ์ดํฐ์ ์ดํ๊น์ง ํฌํจ์์ผ ๋ ํ๋ถํ ๋จ์ด ์ฌ์ ์ ๋ง๋ค๋ฉด, 'Unknown' ํ ํฐ์ผ๋ก ์ธํ ์ ๋ณด ์์ค์ ์ค์ฌ ์ ๋ฐ์ ์ธ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์์ ๊ธฐ๋ํ ์ ์์ต๋๋ค.
- 0
- 1
- 33
Q&A
concat ์ ํตํ ๋ฐ์ดํฐ ํ๋ ์ ํฉ์น๊ธฐ ์๋ฌ ๋ฌธ์
์๋ ํ์ธ์. ํด๋น ๊ธฐ๋ฅ์ ์ฌ์ฉํ๋ ์ฅ์ ์ด ์ด๋ค ์ปฌ๋ผ์ด ์ฌ์ง ๋ชฐ๋ผ๋ ์ปฌ๋ผ ์คํค๋ง๋ฅผ ์ง์ ํ์ง ์๊ณ ์ฌ์ฉํ ์ ์๋ค๋๊ฒ ๊ฐ์ฅ ํฐ ์ฅ์ ์ธ๋ฐ์. ํ๋ค์ค ๊ธฐ๋ฅ์ด ์ ๋ฐ์ดํธ ๋๋ฉด์ ์ปฌ๋ผ๋ช ํ์ ๋ฑ์ด ๋ถ์ผ์น ๋๋ ๋ฐ์ดํฐ์ ๋ํด ๋ณํฉ ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ณ ์์ต๋๋ค. ๊ทธ๋์ ์ ์ฒด๋ฅผ ๋ณํฉํ๊ธฐ ์ ์ ๋ณํฉํ ์ผ๋ถ ์ปฌ๋ผ ์ ๋ณด๋ฅผ ์ง์ ํ๊ณ ๋ณํฉํด ๋ณด์๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค. ์กฐ๋ง๊ฐ ํด๋น ๋ด์ฉ์ ๋ํด ์ฝํ ์ธ ๋ฅผ ์ ๋ฐ์ดํธํ๋๋ก ํ๊ฒ ์ต๋๋ค. ์ด์ฉ์ ๋ถํธ์ ๋๋ ค ์ฃ์กํฉ๋๋ค. ๊ฐ์ฌํฉ๋๋ค!
- 0
- 1
- 41
Q&A
๊ตฌ๊ธ ์ฝ๋ฉ์์ ํ๊ธ ํฐํธ ์ค์
์๋ ํ์ธ์. ์ต๊ทผ์๋ koreanize-matplotlib ์ ์ฌ์ฉํ์๋ ๊ฒ์ ๊ฐ์ฅ ์ถ์ฒํฉ๋๋ค.!pip install koreanize-matplotlib ๋ก ์ค์นํด ์ฃผ์๊ณ ์๋ ์ฒ๋ผ ์ํฌํธ๋ง ํด์ค๋ฉด ๊ฐ๋จํ๊ฒ ํด๊ฒฐ๋ฉ๋๋ค. import koreanize_matplotlib
- 1
- 2
- 896
Q&A
์ฝ๋ ์๋ฌ
์๋ ํ์ธ์. ๋จผ์ AI ์ธํด์ด ๋ต๋ณ์ ํด์ค ๊ฒ์ฒ๋ผ ํด๋น ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ค์น๊ฐ ๋์๋์ง ํ์ธ์ ๋ถํ๋๋ฆฝ๋๋ค.!pip install koreanize-matplotlib์ฃผํผํฐ ๋ด์์ ์ค์นํ๋ค๋ฉด ์ ๋ช ๋ น์ด๋ก ์ค์นํ์๊ณ ์ฌ์ฉํด ๋ณด์ธ์.๊ฐ์ฌํฉ๋๋ค :)
- 0
- 2
- 88
Q&A
๊ฐ์ฑ ๋ถ์์ ํ๋ ค๋ฉด ์ด๋ค ๋ถ๋ถ์ ๊ณต๋ถํด์ผ ํ๋์?
์๋ ํ์ธ์. ๊ฐ์ฑ๋ถ์์ ์ด์ง ๋ถ๋ฅ ๋ฌธ์ ์ ๋๋ค.๊ฐ์ ์น์ 9์์ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋๋ฐ ๋ค์ค ๋ถ๋ฅ๊ฐ ์๋ ์ด์ง ๋ถ๋ฅ๋ก ๊ธ์ ๊ณผ ๋ถ์ ์ ๋ถ๋ฅํ๊ฒ ๋๋ฉด ๊ฐ์ฑ ๋ถ์์ด ๋ฉ๋๋ค.๋, ์ต๊ทผ์๋ ์ง์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐฉ๋ฒ๋ ์์ง๋ง OpenAI API๋ฅผ ํตํด ๊ฐ์ฑ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๋ ๋ฐฉ๋ฒ๋ ์์ต๋๋ค.๊ฐ์ ์น์ 9๋ ๋จธ์ ๋ฌ๋์ ํตํ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ฒ ๋ฉ๋๋ค.์ฐธ๊ณ ๋ฅผ ๋ถํ๋๋ ค์. ๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 147
Q&A
์์ธํ ์ค๋ช ๋ถํ๋๋ ค์ ใ
์๋ ํ์ธ์.ํด๋น ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ช ์นญ์ด ydata-profiling ์ผ๋ก ๋ณ๊ฒฝ๋์์ต๋๋ค. ๋ค์์ ๊ณต์ ๊นํ ๋งํฌ ์ ๋๋ค.[ydataai/ydata-profiling: 1 Line of code data quality profiling & exploratory data analysis for Pandas and Spark DataFrames.](https://github.com/ydataai/ydata-profiling) ๊ทธ๋์ ์ค์นํ๋ ํด๋น ํจํค์ง ์ค์นํ์ จ์ ๋๋ ydata-profiling ์ผ๋ก ์ค์น๊ฐ ๋์๊ธฐ ๋๋ฌธ์ pandas-profiling ์ผ๋ก ์ฐพ์ผ์๋ฉด ์ ๋์ฌ ์ ์์ด์. ydata-profiling ์ผ๋ก ์ฐพ์๋ณด์๊ฒ ์ด์? ๋, ๋งํฌ๋ ์ด๋ค ์ด์์ฒด์ ๋ฅผ ์ฌ์ฉํ๊ณ ์๋์ง, conda, pip ๋ฑ์ ๋ฐ๋ผ ๋ค๋ฅธ ์์น์ ์ค์น ๋ฉ๋๋ค.๊ทธ๋์ ํด๋๋ฅผ ์ด์ด ํ๋์ฉ ์ฐพ์๋ณด์ ์ผ ํด์.ํด๋น ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ํฐํธ ์ค์ ์ด ๊น๋ค๋ก์์ ์ฌ์ฉ์ ๋ถํธํจ์ ๋๋ ค ์ฃ์กํฉ๋๋ค. ์กฐ๋ง๊ฐ ํด๋น ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ฌ์ฉ์ ๋ํด ๊ฐ์ ์ ๋ฐ์ดํธ๋ฅผ ํ ์ ์๋๋ก ํ๊ฒ ์ต๋๋ค.๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 128
Q&A
seaborn ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํธ์ถํ์์ผ๋ ๊ทธ๋ํ๊ฐ ์ ๊ทธ๋ ค์ ธ์
์๋ ํ์ธ์. ์ฌ๋ ค์ฃผ์ ์ฝ๋๋ฅผ ๋ณด๋ ๋๋ถ๋ถ ์ ์์ฑํด ์ฃผ์ จ์ต๋๋ค.๋ณดํต์ ๊ทธ๋ํ๊ฐ ํ์๋์ง ์์ผ๋ฉด %matplotlib inline ๋ฅผ ํตํด ํ์๋ฅผ ํ๋๋ฐ ์ด ๋ํ ์ ์์ฑ๋ ๊ฒ์ผ๋ก ๋ณด์ฌ์ง๋๋ค. AI์ธํด์ด ๋ต๋ณํด ์ค ๊ฒ์ฒ๋ผ ์๊ฐํ ์ฝ๋ ์๋ซ์ค์ด plt.show()๋ฅผ ์ถ๊ฐํด ๋ณด์๊ณ ๊ทธ๋๋ ์ ๋๋ค๋ฉด ๋ค์ ์ง๋ฌธ ์ฃผ์ธ์.plt.figure(figsize=(10, 3))sns.barplot(data=df_last, x="์ง์ญ๋ช ", y="ํ๋น๋ถ์๊ฐ๊ฒฉ") ์ ํด๊ฒฐ๋๊ธธ ๋ฐ๋ผ๊ฒ ์ต๋๋ค.๊ฐ์ฌํฉ๋๋ค.plt.show()
- 0
- 2
- 172