ํ์ฌ ๋๊ธฐ์ ์ค์ฌ์ผ๋ก ์๋์ ๊ฐ์ ํ๋ก์ ํธ์ ๊ฐ๋ฐ์ฑ ์ ๋ฐ ์ปจ์คํ ์ ๋งก๊ณ ์์ต๋๋ค. ํ์ญ^^์ ๋๋ค.
๋๋ถ์ด, ๊ณ ๋ ค๋ ๋ํ์์์ ์ธ๊ณต์ง๋ฅ ๊ด๋ จ ๊ฒธ์๊ต์๋ก๋ ํ๋ํ๊ณ ์์ต๋๋ค.
์ ์ ๋ชฉํ๋ ์ค์ ์ ๋ฐ๋ก ์จ๋จน์ ์ ์๋ ํ์ฅ๊ฐ ์๋ ํ๋ก๊ทธ๋๋ฐ ๊ธฐ์ ์ ๋๋ค. ์์ผ๋ก ๋ง์ ์ฌ๋ฌ๋ถ๊ณผ ํจ๊ป ์ฌ๋ฏธ๋ ์์ ๋ง๋ค์ด ๋๊ฐ๊ณ ์ถ์ต๋๋ค.
์ํฐํ๋ผ์ด์ฆ ์ธ๊ณต์ง๋ฅ ๊ตฌ์กฐ ๋ฐ ์๋น์ค ์ค๊ณ
๋จธ์ ๋ฌ๋ ์๋น์ค ๊ตฌํ
๋ฒก์๋ ์๋น์ค ๊ฐ๋ฐ
ํด๋ผ์ฐ๋(Azure) Databricks, ETL, Fabric ๋ฑ ๊ฐ์ข ํด๋ผ์ฐ๋ ํ๊ฒฝ์์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ตฌ์ถ ๋ฐ ์๋น์ค ๊ฐ๋ฐ
Courses
Reviews
main33730814
ยท
All-in-one masterclass from development to deployment for computer vision anomaly detectionAll-in-one masterclass from development to deployment for computer vision anomaly detectioneverythx
ยท
All-in-one masterclass from development to deployment for computer vision anomaly detectionAll-in-one masterclass from development to deployment for computer vision anomaly detection- All-in-one masterclass from development to deployment for computer vision anomaly detection
cjnyung5173
ยท
All-in-one masterclass from development to deployment for computer vision anomaly detectionAll-in-one masterclass from development to deployment for computer vision anomaly detection
Posts
Q&A
ํตํฉ ํ๋ ์์ํฌ ๊ฐ์ ์์ฒญ๋๋ฆฝ๋๋ค
์๋ ํ์ธ์,๊ฐ์๊ฐ ๋์์ด ๋์๋ค๋ ๊ธฐ์ฉ๋๋ค. MLOps ์ ๋ํ์ฌ ๊ด์ฌ์ด ๋ง์ผ์๊ตฐ์. ์์ฑํ AI ์๋์ ๊ฐ๊ณผํ๊ธฐ ์ฌ์ด ML์ ์ค์์ฑ์ ์ ์๊ณ ์์ผ์ ์, ๋ฐ์ด๋ ๊ฐ๋ฐ์๊ฐ ๋ ๊ฒ์ด๋ผ ๋ฏฟ์ต๋๋ค. ์๊ทธ๋๋ ์ธํ๋ฐ ์ธก์์ MLOps ๊ฐ์์ ๋ํ ์์ฒญ์ ๊พธ์คํ ํด ์์ ์ด๋ค ์ฃผ์ ๋ฅผ ๋ค๋ฃฐ๊น ๊ตฌ์์ค์ด์๋๋ฐ์. ํ์ฌ ์์ ์ค์ธ RAG All Master ๊ฐ์๊ฐ ์๋ฃ๋๋๋๋ก MLOps ๊ฐ์๋ฅผ ์ค๋นํด ๋ด์ผ๊ฒ ๋ค๋ ์๊ฐ์ด ๋๋ค์. ํน์ ๋ณธ์ธ์ ๋ฌผ๋ก ํ์ต์์ ์ ์ฅ์์ ์๊ฐํ๊ณ ์๋ ์ข ๋ ๊ตฌ์ฒด์ ์ธ end-to-end MLOps ๊ฐ์์ ๋ํ ์๊ฒฌ์ ์ฃผ์๋ฉด ๊ณ ๋ง๊ฒ ์ต๋๋ค.ํนํ, '์ค์ ๋ก ์ฌ์ฉํ๋ ๋ชจ์ต', 'ํํธ๋น ์ฐ๊ฒฐ๋๋ ๋ถ๋ถ', '์ต์ข ์ ์ผ๋ก ๋ฐฐ์ด ๊ฒ๋ค์ ์ตํฉ' ์ด๋ ํค์๋์์ ๋๋ ์ ์, ํ์ต์ฉ ๊ด์ ์ด ์๋ '์จ์ ํ ๊ธฐ๋ฅํ๋ MLOps' ์ค์ ํ๋ก์ ํธ ๋๋ ์ค์ ํ๋ก์ ํธ์ ๋์ผํ ์ค์ผ์ผ์ ๋ด์ฉ์ด ๋ด๊ฒจ์ก์ผ๋ฉด ํ๋ ๊ฒ์ผ๋ก ์ฝํ๋๋ค.^^ ํผ๋๋ฐฑ ์ฃผ์๋ฉด ๊ณ ๋ง๊ฒ ์ต๋๋ค~
- 0
- 2
- 28
Q&A
32๊ฐ ๊ฐ์๊ฐ ์งค๋ฆฐ๊ฑฐ ๊ฐ์ต๋๋ค.
์๋ ํ์ธ์, ๋ถํธํจ์ ๋๋ ค ์ฃ์กํ๋ค์. ์ ๋ ๋ฌด์ฒ ๋นํฉํ๋๋ฐ์, ๊ฐ์๊ฐ ์๋ฆฐ ๊ฒ์ด ์๋๋ผ, ์ธํ๋ฐ ์๋ฒ ์ชฝ์ ๋ฌธ์ ์ธ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฐ์ ์์์ ์ ์์ ์ผ๋ก ์ ๋ก๋ ๋์๊ณ , ์ง๊ธ๊น์ง ์ด์ ๊ฐ์ ๋ฌธ์ ๋ ์์๊ฑฐ๋ ์.ํน์๋, ํด์ ๋ค์ ๋ค์ด๊ฐ ๋ด๋ ์์์๋ ๋ฌธ์ ๊ฐ ์๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค. ๊ณ ๊ฐ์ผํฐ๋ก ๋ฌธ์๋ฅผ ํด ์ฃผ์ ์ผ ํ ๊ฒ ๊ฐ์์. ๋ง์ผ ์ผ์์ ์ธ ์ธํ๋ฐ ์๋ฒ ์ฅ์ ์๋ค๋ฉด, ์๋ง ์ ๊ฐ ๋ต๋ณ์ ์์ฑํ๊ณ ์๋ ์ง๊ธ์ฏค ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋์ง ์์์๊น ์ถ์ต๋๋ค. ๊ทธ๋ผ ์ด๊ณตํ์๊ตฌ์~๊ฐ์ฌํฉ๋๋ค.
- 0
- 2
- 18
Q&A
์ฒดํ ๊ณ์ ์์๋ End-point ์์ฑ์ด ์ ๋๋๊ฑธ๊น์?
์๋ ํ์ธ์,๊ฐ์ ๋ง์ง๋ง ๊ณผ์ ๊น์ง ๋๋ฌํ์ จ๊ตฐ์. ๋ฐฐ์์ ์ด์ ์ ๊ฒฉํ๊ฒ ์์ํฉ๋๋ค! ์ง๋ฌธํ์ ๋ด์ฉ์ ํ์ธํด ๋ณด๋, ์ ๋ ๋ช ๋ฌ ๋ง์ databricks ์ ๋ค์ด์ ๋ด ๋๋ค. ์ง๋ฌธํ์ ๋ด์ฉ์ ํ์ธํด ๋ณด๋ Legacy serving[deprecated] ๋ผ๊ณ ๋์ค๋ค์. ์๋ ์บก์ณ ํ๋ฉด์ ์ฐธ๊ณ ํ์ธ์.๋ญ, ๊ทธ๋ ๋ค๊ณ databricks ์์ model serving endpoint ๋ผ๋ ๊ธฐ๋ฅ ์์ฒด๋ฅผ ์์จ ์๋ ์๊ตฌ์(์๋ํ๋ฉด, ์ด ๊ธฐ๋ฅ์ด ์๋ค๋ฉด ๋๊ฐ databricks ์ฌ์ฉํ๊ฒ ์ต๋๊น^^). ์์ธํ ๋ณด๋ฉด ์ฐ์ธก ์๋จ์ 'Use model for inference' ๋ฉ๋ด๊ฐ ๋์ ์๊ฒผ๋ค์. ์ด๊ณณ์์ endpoint ๋ฅผ ์์ฑํด์ ์ฌ์ฉํ๋๋ก ๋์ด ์๋ค์. ๋ด์ฉ์ ์ดํด๋ณด๋, ์ข ์ ์ legacy serving ์์์ endpoint ์๋ ๋ฌ๋ฆฌ Real-time, Streaming, Batch Inference ๋ก ์ธ๋ถํ ๋์ ๋ชจ๋ธ์ ์๋นํ ์ ์๋๋ก ๋์ด ์๋ค์. ์ด ๊ฐ์ด๋ฐ, ์ค์ ๋ก REST API ๊ฐ์ ๊ฐ๋ ์ ํด๋นํ๋ (์ข ์ ์ legacy serving) ๊ฒ์ 'Real-time' ์ด๋ค์. ๊ทธ๋ผ ๋๊น์ง ์๊ฐํ์๊ณ ! ์ด๊ณต! Legacy serving ๋ฉ๋ด ๋ ์ด์ ์ ๊ณต ์ํจ(์ฌ์ง) ์๋ก์ด ๋ฉ๋ด: Use model for Inference (์ฌ์ง)
- 0
- 1
- 29
Q&A
์ด์์น ๋ฐ์ดํฐ ํฉ์ฑ ๋ฐ ๊ธฐ๋ณธ๋ฐ์ดํฐ์ ์์ฑ
^^๋ชจ๋ ์ฝ๋๋ github ์ ์์ด์.๊ฐ์ ์๋ด์ ์ฌ๋ผ๊ฐ ์๋ต๋๋ค~
- 0
- 2
- 46
Q&A
ํํฐ์ ์ดํดํ๊ธฐ ๊ฐ์ ๋ถ๋ถ ์ง๋ฌธ์์ต๋๋ค.
๋ค, ๋ฌธ์ ์์ต๋๋ค. Spark ์ ๋์ ํต์ฌ ์๋ฆฌ์ ๋ํ ์ดํด๋ฅผ ์ํ ๋ถ๋ถ์ด๋ฉฐ, ๊ฐ๋ ์ ์ธ ์ดํด๋ฅผ ๋๊ธฐ์ํ ์ ์์ ์์ฐ์ค๋ฝ๊ฒ ๋์ด๊ฐ๋ฉด ๋ฉ๋๋ค. ์ด๊ณตํ์ธ์~
- 1
- 2
- 29
Q&A
OrderedDict() ์ง๋ฌธ
๋ค, ๋ง์ต๋๋ค. ์๊ณ ์๋ ๋ฐ ๋๋ก, ํด๋น ์ฝ๋์์๋ ๊ตณ์ด OrderedDict() ๋ฅผ ์ฌ์ฉํ ํ์๋ ์์ต๋๋ค.์ ์ ์ค๋ ์ต๊ด์ ๋๋ค^^
- 1
- 1
- 39
Q&A
์ค๋ฌด OCR์ ์ํ ์ฌ๋ ์ง๋ฌธ
๊น์ ๊ณ ๋ฏผ๊ณผ ์ฌ์์ด ๋ด๊ธด ์ง๋ฌธ์ ๊ฐ๋^^์ด๋ค์. ๊ทธ๋งํผ ๊ฐ์ ๋ด์ฉ์ ๊ผผ๊ผผํ ์ฑ๊ฒผ๋ค๋ ๋ฐ์ฆ์ด๊ธฐ๋ ํ๊ฒ ์ฃ . ์ด์ฌํ ๊ณต๋ถํ๋ ์๊ฐ์๋ถ๋ค์ด ์์ด์ ํ๋ณตํฉ๋๋ค. ๊ฐ์คํ๊ณ ์ง๋ฌธ์ด ๋ฐฉ๋ํ ์ง๋ผ ํ๋ ํ๋ ์ง์ด๊ฐ๋ฉด ๋ต๋ณ์ ๋๋ ค๋ณผ๊ฒ์. 1. ์ต์ OCR model ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์ จ๋๋ฐ, ๊ฒฐ๊ตญ์ multi modal LLM์ ์ฐ๋ฉด ๋ง์ฌ ๋ฅํตํ ๊ฒ์ฒ๋ผ ๊ฒฐ๋ก ์ด ๋ด๋ ค์ง๋๋ค. ๊ทธ๋ ๋ค๋ฉด OCR model๋ณด๋ค๋ image์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ LLM model ๋น๊ตํ๋ ๊ฒ ๋ ๋ง๋ค๊ณ ์๊ฐ์ด ๋ญ๋๋ค. ์ด๋ป๊ฒ ์๊ฐํ์๋์?=> ์ํฉ์ ๋ฐ๋ผ ์ง๋ฌธ์๊ฐ ๊ทธ๋ ๊ฒ ๋๋ ๋ถ๋ถ๋ ์์ ๊ฒ ๊ฐ๋ค๋ ์๊ฐ์ด ๋๋ค์. multi-modal LLM ์ด ๋ง์ฌ ๋ฅํต์ฒ๋ผ ๋๊ปด์ก๋ค๋ฉด, ํ์ฌ๋ก์๋ ๋จํธํ๊ฒ ๊ทธ๋ ์ง ์๋ค๊ณ ๋งํ ์ ์๊ฒ ์ด์. ํ์ง๋ง, ๋จธ์ง ์์ ๋ฏธ๋ (์์ฒญ ๋นจ๋ฆฌ ๋๋ํ ๊ฒ ๊ฐ๋ค๋ ์๊ฐ์ ๋๋ค)์ ๋ง์ OCR ์์ญ์ด LLM์ ํตํด ํด๊ฒฐํ๋ ์๊ฐ์ด ๋ค๊ฐ ์ฌ ๊ฒ์ด๋๋ค. ๋ฌธ์ ๋ LLM ์ด ๋ง๋ฅ์ด ๋๋ค์ ์น๋๋ผ๋, ์๋ ์ง๋ฌธ์์ ์ธ๊ธํ ๋ณด์ ๋ฐ ๋คํธ์ํฌ๊ฐ ๋ถ๊ฐ๋ฅํ ํ์ํ๊ณผ ๊ฐ์ ํ๊ฒฝ์์๋ API๋ฅผ ์ด์ฉํ ์ ์๊ฑฐ๋, ์ด์ฉํ๋๋ผ๋ ๋งค์ฐ ์์ ํด์ผ ํ๋ ์ํฉ์ด ์กด์ฌํฉ๋๋ค. ๋คํธ์ํฌ ์ฐ๊ฒฐ์์ด ์ฌ์ฉํ๋ on-device ์์์ OCR ๋ฑ๋ฑ, LLM ์์ฒด๊ฐ ์ ๊ทผ์ด ๋ถ๊ฐ๋ฅํ ํ๊ฒฝ์ด ๋งค์ฐ ๋ง์ต๋๋ค. ์ด์ฐ๋ณด๋ฉด, ๋ง๋ฅ์ด๋ผ๊ณ ํ๋ LLM์ ์ฌ์ค์ API๋ฅผ ๋์ง๋ ๊ฒ๋ง์ผ๋ก ๋๋ถ๋ถ ํด๊ฒฐ๋๋ฏ๋ก, ์์ค๋์ ๊ฐ๋ฐ์์ ์ญ๋์ด ํ์์์ ๊ฒ๋๋ค. ๊ฐ๋ฐ์๋ก์ ๋ฌด์ฒ ์๊ธฐ๊ฐ์ ๋๋ ์ ๋ฐ์ ์๋ ํ๊ฒฝ์ด ๋๊ฒ ์ฃ . ํ์ง๋ง, ์ธ๊ธํ ํน์ ํ๊ฒฝ(์ ์กฐ์ ๋ฑ ๊ธฐ์ ๋ฐ ์์ ๋ณด์์ด ์๋ช ์ธ ํ๊ฒฝ)์์๋ ์ญ๋์๋ ๊ฐ๋ฐ์์ ์ญํ ์ด ๋งค์ฐ ์ค์ํฉ๋๋ค. ๊ทธ๋ฐ ์๋ฏธ์์, LLM ์ด ๋ง๋ฅ์ด๋ผ๋ ๋๋์ ๊ฐ์ง ํ์๋ ์๋ค๊ณ ์๊ฐํด์.2. LLM image์ฒ๋ฆฌ๊ฐ ์ข์์ง์ผ๋ก์จ, ๊ตณ์ด opencv๋ก ์ฒ๋ฆฌํ์ง ์์๋ ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์ข์ ๊ฒ ๊ฐ์ต๋๋ค. ์์ผ๋ก๋ ์ด๋ฌํ ์์ ์ด ํ์ํ ๊น์? (๊ทธ๋ฅ LLM์ ๋ฃ๋ ๊ฒ๊ณผ opencv๋ก ์ ์ฒ๋ฆฌํ ๊ฒ๊ณผ ๋น๊ตํ๋ ์คํ๋ ์ฒจ๋ถํด ์ฃผ์ จ์ผ๋ฉด ์ข๊ฒ ์ต๋๋ค.)=> 1๋ฒ ๋ต๋ณ์ ์ฒจ์ธํด์ ๋ด๋ณํ๋๋ก ํ ๊ฒ์.ํ , ์ด ์คํ์ ๋ณ๋๋ก ์ ๋ฆฌํ ๊ฒ์ด ์๊ธด ํ๋ฐ, ๊ฒฐ๋ก ์ ์ผ๋ก ๋งํ๋ฉด LLM ์ ํต์งธ๋ก ๋ฃ์ด์ json ์ถ์ถ์ ํ ๊ฒฐ๊ณผ, accuracy ์ ์ฌ๊ฐํ ์ค๋ฅ๊ฐ ๋ง์ต๋๋ค. ์ ํ, ์ธ๋ชจ๊ฐ ์์ ์์ค์ด์์ต๋๋ค. ํด๋น ์คํ๊ณผ ๊ฐ๋ ๊ฒ์ฆ์ ์ ๊ฐ ์ง์ E-mart ์๊ฒ ์ ๋ฌํ์์๋๋ฐ์^^, ์ด ๋ถ๋ถ์ ๊ฐ์์ ์ง์ ๋ด์ ์๋ ์์์ต๋๋ค. ๊ทธ๋์ ํ์ฌ๋ก์๋ LLM ์ ์ ์ ์ผ๋ก ์์กดํ๊ธฐ์๋ ์ ๋ณด์ค๋ฅ๊ฐ ๋๋ฌด ์ฌํด์ opencv ์ ๊ฐ๋ฏธํ 'ํ์ด๋ธ๋ฆฌ๋' ์ ๊ทผ๋ฒ์ ์ฑํํ์๋ต๋๋ค.3. ๋ณดํต ๊ธฐ์ ์์ OCR์ ์ฌ์ฉํ ๋๋ ๊ฐ์ธ์ ๋ณด๋ฅผ ํฌํจํ ๋ฌธ์๊ฐ ๋ง์ต๋๋ค. ์ธ๋ถ LLM ์ฌ์ฉ์ ๊บผ๋ฆด ๋๊ฐ ๋ง์ต๋๋ค. sLLM์ผ๋ก ์ฒ๋ฆฌํ๊ณ ์ถ์๋ฐ, function calling์ด๋, pydantic๊ณผ ๊ฐ์ ์์ ์ฒ๋ฆฌ๊ฐ ์ด๋ ต์ต๋๋ค. ์ด๋ป๊ฒ ํด๊ฒฐํ ์ ์์๊น์?=> sLM ์ ๊ฒฝ์ฐ multi-modal ์์ ํ๊ธ์ ์ธ์๋ฅ ์ ๋งค์ฐ ์ค๋ง์ค๋ฌ์ด ๊ฒ์ด ํ์ค์ธ๋ฐ์. ์๋ฌธ ์ธ์์ด ์๋๋ผ๋ฉด ๋น๋ถ๊ฐ ์ด ์์ญ์ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์์ค์ ์ด๋ฅด๊ธฐ๊น์ง๋ ์๋นํ ์ค๋ ๊ฑธ๋ฆด ๊ฒ์ผ๋ก ์์ํฉ๋๋ค. ํ๊ธ์ ์ด ๋ถ์ผ์์ ์ฐธ ๋ต๋ตํ ์๋์ ์ฐธ๋ดํ๊ธฐ ์ง์ด ์๋๋ฐ์. ๋ฐ๋ผ์, sLM ๋ณด๋ค๋ opencv ๋ฑ์ ํ์ฉํ OCR ๋ฐฉ๋ฒ๋ก ์ด ๋ ํ์ค์ ์ผ ๊ฒ์ ํ๋จ๋ฉ๋๋ค.sLM ์์ multi-modal ๋ชจ๋ธ์ ์ด์ฉํ ๋๋ ํ์ฌ response format ์ ์ง์ํ๋ ๊ฒ์ด ์๋ ๊ฒ์ผ๋ก ์๊ณ ์์ด์. ์ด ์ง๋ฌธ์ ํ ๊ฒ์ผ๋ก ๋ณด๋ฉด multi-modal ์ด ์๋ sLM ์์์ response format ์ ํ์ฉํ๋ ๋ฒ์ ๋ํด์๋ ์ด๋ฏธ ์ดํด๊ฐ ์๋ ๊ฒ์ผ๋ก ํ์ ๋์ด ๋ต๋ณ์ ์๋ตํ๋๋ก ํ ๊ฒ์. 4. pipeline์ ์ ๋ฆฌํ๋ฉด,opencv ์ ์ฒ๋ฆฌ -> cropping -> LLM ๊ตฌ์กฐ์ ๋๋ค. ์ํ๋ ์์๋๋ก ๋ง๋๋ ์์ ์ LLM ์ฑ๋ฅ๊ณผ prompt์ ์ญ๋์ผ๋ก ๋ณด์ ๋๋ค. ๋ฌธ์ ๋ ๋ฌธ์์ ์์์ด ๋ค์ํด์ ํ ๋ฌธ์ ์์์ ์ถ์ถํ ๋๋ง๋ค ๋ณต์กํ prompt๋ฅผ ์์ฑํด์ผ ํ๋ ๊ฒ์ผ๊น์? ๋ํ ๋ฌธ์ ์ข ๋ฅ๊ฐ ๋ฌ๋ผ์ง ๋๋ง๋ค ์์ ํด์ผ ํ ๊น์?=> Microsoft, Amanzon ๋ฑ์์ ์ ๊ณตํ๋ LLM ์ ํตํ OCR ์๋น์ค๋ฅผ ๋ณด๋ฉด, layout ์ ๋จผ์ ์ธ์ํ๋ ๊ณผ์ ์ด backend ๋ก ๊น๋ ค ์์์ ์ ์ ์์ด์. ์ฆ, ์์ฒญํ๋ ๋ฌธ์๋ 'tax report'์ผ, ๋ผ๊ณ API ์ ๋์ง ๋ ์์ layout template ์ ํํ๋ฅผ ์ง์ ํด ์ฃผ๋ ๊ฑฐ์ฃ . ํ์ฌ์์ ์ง์ํด์ ์ด๋ ๊ฒ ์ง์๋๋ ์์๋ค์ ๊ฐ์๊ฐ ์ ๋ฐ์ดํธ ๋๋ ํํ์ ๋๋ค. ๊ฒฐ๊ตญ, LLM ์ด์ ์ layout ์ ์ผ๋ง๋ ์ ํํ๊ฒ ์ธ์ํ๋๊ฐ, ๊ทธ๋ฆฌ๊ณ ๋์ ์์ OCR ์์ง์ ์ฌ์ฉํ๋ LLM ์ ์ฌ์ฉํ๋ ์ง ํ๊ฒ ๋ฉ๋๋ค. ์ด๋ฌํ ์ฌ์ฉํ๊ฒฝ์์๋ prompt engineering ์ด ๋ถํ์ํ๋ฉฐ, layout ์ ๋ํ ์ ๋ณด๋ง ๋๊ฒจ์ฃผ๋ฉด ๋ฉ๋๋ค. ์ถ์ถํ ๊ฒฐ๊ณผ๋ฌผ์ ๋ํ ๋ค์ํ ์๋ฆฌ๋ ์ฌ์ฉํ๊ฐ ์์์ ํ๋ ๋ถ๋ถ์ด๋ผ ์ด ๋ถ๋ถ์ ์ธ๊ธํ์ง ์์๊ฒ์. ๋ง์ฝ ์ด๋ฌํ ๊ฒ์ด๋ผ๋ฉด ๊ธฐ์กด OCR๊ณผ ๊ฐ์ด ๋ฌธ์ ์ข ๋ฅ๋ณ๋ก OCR format์ด ๋ค ๋ค๋ฅด๊ฒ ์ ํด์ ธ์ผ ํ ํ ๋ฐ, ์ด๋ป๊ฒ ํด๊ฒฐํ ์ ์์๊น์?=> ์์ ๋ต๋ณ์ ๋ณด๋ฉด ์์ํ์ จ๊ฒ ์ง๋ง, ํ ๋ฐฉ์ ๋ชจ๋ ๋ฌธ์์ ๋ํ OCR์ ์ฒ๋ฆฌํ๋ ๊ธฐ๋ฒ์ ํ์ฌ๋ก์๋ ์กด์ฌํ์ง ์์ต๋๋ค. ์ต๊ณ ์ IT ๊ธฐ์ ๋ค์์ OCR์ ๋ฐฉ๋ฒ๋ก ์ ์ ๊ทผํ๋ ๋ถ๋ถ์ ๋ํ ๋ด์ฉ์ ๋ณด๋ฉด ๊ฒฐ๊ตญ ํ์ฌ๋ก์๋ layout ์ธ์๋ฅ ์ด ๋์ ๋ชจ๋ธ๋ค์ ๊พธ์คํ ๋ง๋ค์ด์ ๋์ํ๋ ๊ฒ์ด ์ต์ ์ด๋ผ๊ณ ํ๋จํ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ด๋ค ๊ธฐ์ ์ด ํ๋ ๊ฒ์ด ๊ทธ๋ ๋ฏ์ด, ์์๊ฐ ๋ง์ ํํ์ document layout ์ ๋ํด์๋ ์ ํ๊ณผ ์ง์ค์ด ์ด๋ฃจ์ด์ง๊ฒ ์ง๋ง, ๊ทธ๋ ์ง ์์ domain-specific ํ document layout ์ ๋ํด์๋ ์ฌ์ ํ ๊ฐ์ผํ ๊ธธ์ด ๋ฉ๊ฒ ์ฃ . ์๋ จ๋ ๊ฐ๋ฐ์๊ฐ ๋น์ ๋ฐํํด์ผ ํ๋ ๋ถ๋ถ์ด ๋๊ฒ ์ต๋๋ค.์ ๋จ์ง๋ง๊ณ ๋ค๋ฅธ ์ฌ๋ฌ ๋ฌธ์๋ค๋ ๋๊ฐ์ด ์ ์ฉ๋ ์ ์๋์ง ๋ค์ํ ๋ฌธ์๋ค์ ๋ํ OCR ์์ ์์ ๊ฐ์๋ฅผ ๋ ์ฌ๋ ค์ฃผ์๊ธธ ๋ฐ๋๋๋ค.=> ๋ต, ๊ฒฉ๋ ค ๊ฐ์ฌํ๊ณ ์, ์ฐธ๊ณ ํด์ ๋ ์ข์ ๊ฐ์๋ก ๋ง๋ ์ ์๊ธธ ๊ณ ๋ํฉ๋๋ค~
- 1
- 2
- 46
Q&A
ํจ์ input ํ์ ์ง์ ์ธ ์ถ๊ฐ raise ๊ตฌ์ฑ
^^ ๋ค,ํน์ ๊ฐ์ ์ฐจ์ ๋๋ ๋ง์ํ์๋ ์ฝ๋๋ฅผ ํจ๊ป ์ ๊ณตํด ์ฃผ๋ฉด ์ ํํ ๋ต๋ณ์ด ๊ฐ๋ฅํ ๊ฒ ๊ฐ์์^^์ฃผ์ ์ง๋ฌธ์ ์๋๋ฅผ ๋ณผ ๋, typing ์ ๋ง์ง ์๋ ๊ฒฝ์ฐ์ python ์ ์ ๋ ฅ ๊ฐ์ ๊ฐ์ ํ๋ ๊ธฐ๋ฅ์ด ์๊ธฐ ๋๋ฌธ์ ๋ณ๋๋ก validate_path ๋ฅผ ์์ฑํ ๊ฒ์ด์์ ๊ฒ๋๋ค. ํด๋น ๊ธฐ๋ฅ์ production ์ํฉ์ ์ํด ํ์ํ ๊ฒ์ด๋ฉฐ, dev ํ๊ฒฝ์์๋ ๊ตณ์ด ์ค์ํ ๋ถ๋ถ์ ์๋๋๋ค. ํ์ง๋ง, ๋ค๋ฅธ ์ธ์ด๋ค์ ์ข์ ์ฅ์ , ์ฆ variable ์ ์ ๋ ฅ ๊ฐ์ type ์ด ๊ฐ์ ์ ์ผ๋ก ์ ์ธ๋๊ณ ์ฌ์ ์ ํต์ ๋ ์ ์๋ ์๋จ์ ์ฐจ์ฉํ๋ฉด ์๋ฌ๋ฅผ ์ฌ์ ์ ๋ฐฉ์งํ๊ณ ์์ ์ ์ธ production ํ๊ฒฝ์ ๊ฐ์ ธ๊ฐ ์ ์๋ค๋ ์ ์์, ๊ทธ์ ๊ฐ์ ์ต๊ด์ ๊ธฐ๋ฅด์๋ ์ธก๋ฉด์์ ์๋ง ์ฝ๋๋ฅผ ์ถ๊ฐํ์์ ๊ฒ๋๋ค. ์์ธํ ์ฝ๋๊ฐ ์๋ ์ํฉ์์ ๊ธฐ์ต์ ์์กดํด ๋ต๋ณํ๋๋ฐ๋ ํ๊ณ๊ฐ ์์ด^^ ํน์ ๋ต๋ณ์ด ๋ถ์กฑํ๋ค๋ฉด, ์ถ๊ฐ๋ก ์ง๋ฌธ์ฃผ์ธ์~ ์ด๊ณต!
- 1
- 2
- 48
Q&A
์ ์ฒด ์ฝ๋๋ ์ด๋์์ ๋ณผ ์ ์๋์?
๊ฐ์๋ด์ฉ์ github ์ฃผ์๋ฅผ ๊ณต์ ํ๋๋ฐ ํน์ ํ์ธ์ด ์๋์ค๊น์?
- 1
- 3
- 77
Q&A
๋ผ๋ฒจ๋ง์ ํตํ ๋ฐ์ดํฐ ์์ฑ
๊น์ ๊ณ ๋ฏผ์ด ๋ด๊ธด ์ง๋ฌธ์ ํตํด, ์ ๊ฐ์๊ฐ ๋์์ด ๋๊ณ ์๋ค๊ณ ์๊ฐํด๋ ๋ ๊น์?^^ ๋ฐฐ์์ ๋ํ ์ด์ ์ ์ ๊น์ง ํ๋ญํด ์ง๋๋ค. ์ค์ ํ์ฅ์์ ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ฉด, '์ธ๊ฐ์ ์ธ์ด์ ์ํด, ์ธ์ด๋ฅผ ํตํด, ์ธ์ด๋ฅผ ์ํด' ์ํตํ๊ณ ์ธ์์ ์ดํดํ๊ณ ์๊ตฌ๋๋ฅผ ์ฐธ ๋ง์ด ๋๋๋๋ค. scalar ๋ก ๋ ๋ฐ์ดํฐ๊ฐ ์๋ ML(๋ฅ๋ฌ๋, ์์ฑํ ๋ชจ๋ ํฌํจ)์ ๋์์ด ๋๋ ๋ชจ๋ ๋น์ ํ ๋ฐ์ดํฐ์ ๊ทผ๊ฐ์ '์ธ๊ฐ์ ์ธ์ด'๋ผ๊ณ ๋ด๋ ๋ฌด๋ฐฉํ ์ ๋๋ก ๊ทธ ์ด์์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ค์ ๊ฒฝํํ๊ธฐ๋ ๋ถ๊ฐ๋ฅํฉ๋๋ค. ์ด๊ฒ ์ฐ๋ฆฌ๊ฐ ์ฌ๋ ์ธ๊ณ์ด๋ฉฐ, ์ฐ๋ฆฌ๊ฐ ์ธ๊ณ๋ฅผ ์ดํดํ๊ณ ์ํตํ๋ ๋ฐฉ์์ด๊ธฐ๋ ํฉ๋๋ค. ๋ฐ๋ผ์, LLM ๊ณผ ๊ฐ์ ์์ฑํ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ด๋ฌํ ์ธ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฑ๋ ๊ฒ์ผ๋ก ์ธ๊ฐ์ ์ฌ๊ณ ๋ก ๋ง๋ค์ด ๋ผ ์ ์๋ ํํ๊ณผ ๊ด๋ จํ์ฌ ๋ฌธ๋งฅ์ ํ๋ฆ์ ๊ฐ์ฅ ์ ํฉํ '๋ผ๋ฒจ๋ง'์ ํ ์ ์๋ ๊ฒ์ด ๊ฐ์ฅ ํฐ ์ฅ์ ์ ๋๋ค. ํ๋ก์ ํธ๋ฅผ ํ๋ค ๋ณด๋ฉด '๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ ์ด๋?' ๋ผ๋ ์ฑ๋ฆฐ์ง๋ฅผ ๋ฐ๊ฒ ๋๋๋ฐ์, ๋ฌธ์ ์ ํต์ฌ์ ์ถ์ ํ๋ค ๋ณด๋ฉด ๊ฒฐ๊ตญ ๋ฌธ์ ๋ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ฃผ์ฒด ๋๋ ๋ฐ์ดํฐ์ ์๋ณธ ์์ค๊ฐ '๋ถ์์ ' ํ๊ฑฐ๋ '์ค์ผ'๋์๊ฑฐ๋, 'biased' ๋์ด ์๊ฑฐ๋, '๋ชจํธ'ํ๊ฑฐ๋ ํ ๊ฒฝ์ฐ๊ฐ 100%์ ๋๋ค. ์ฌ์ง์ด ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํ๋ ์ฃผ์ฒด๊ฐ '๊ฐ๋ ' ์ ๋น๋กฏ taxonomy ์ ๊ธฐ์ค์ ์๋ชป ๋ง๋ค์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ๊ฒฝ์ฐ๊ฐ ๋๋ถ๋ถ์ด๋ฉฐ(์ ๋ ์ฌ์ค 100%๋ผ๊ณ ์๊ฐํฉ๋๋ค), ๊ทธ ๊ฒฐ๊ณผ ๋ชจ๋ธ์ด ์ ์ฑ๋ฅ์ ๋ด์ง ๋ชปํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ฐ๋ผ์, LLM ์ ๋์์ผ๋ก '๋ผ๋ฒจ๋ง'์ ์์ฑํ๋ ๊ฒ์ ๊ฐ์ฅ ํฐ ์ฅ์ ์ ์ด๋ฌํ '์จ์ ์น ๋ชปํ' ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ๊ฐ๋ฅ์ฑ์ ํฌ๊ฒ ์ค์ฌ์ค ์ ์์ต๋๋ค. ์ฌ์ง์ด post-processing ์ ์ผํ์ผ๋ก human rating์ ๊ฐ๋ฏธํ ์ฌ๋ ฅ์ด ๋๋ค๋ฉด ์ต์ข ๋ฐ์ดํฐ์ '์๊ฒฐ์ฑ'์ ํจ๊ณผ์ ์ผ๋ก ๋ฌ์ฑํ ์ ์๊ฒ ๋๋ ๊ฑฐ์ฃ . ๊ฒฐ๊ตญ, ๋น์ฉ๊ณผ ํจ๊ณผ๋ฅผ ์ํ ์ ์ธ์ ์ฌ๋ ค๋๊ณ ํ์ค์ ๋ง์ฃผํ ๋(์ค์ ํ๋ก์ ํธ๋ ๊ฒฐ๊ตญ ๋๊ณผ ์๊ฐ์ด๋ ๊ธฐํ๋น์ฉ๋๋น ๊ธฐ๋ํจ๊ณผ ์ด๋ ์ค๊ฐ์์ ์์ฌ๊ฒฐ์ ์ด ์ด๋ฃจ์ด์ง๋๋ค), LLM์ ์ถฉ๋ถํ ์๋ จ๋ ์ธ๋ ฅ์ผ๋ก ์์ ํ๋ ๊ฒ ์ด์ ํจ๊ณผ๋ฅผ ์ป์ ์ ์๋ค๊ณ ๋ด ๋๋ค. ์ด๊ณตํ์ธ์!
- 1
- 2
- 67