์ฑ„๋„ํ†ก ์•„์ด์ฝ˜

[VLM101] ํŒŒ์ธํŠœ๋‹์œผ๋กœ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฑ—๋ด‡ ๋งŒ๋“ค๊ธฐ (feat.MCP / RunPod)

๋น„์ „-์–ธ์–ด ๋ชจ๋ธ(Vision-Language Model, VLM)์˜ ๊ฐœ๋…๊ณผ ํ™œ์šฉ ๋ฐฉ๋ฒ•์„ ์ดํ•ดํ•˜๊ณ , ์‹ค์ œ๋กœ LLaVA ๋ชจ๋ธ์„ Ollama ๊ธฐ๋ฐ˜ ํ™˜๊ฒฝ์—์„œ ์‹คํ–‰ํ•˜๋ฉฐ MCP(Model Context Protocol)์™€ ์—ฐ๋™ํ•˜๋Š” ๊ณผ์ •์„ ์‹ค์Šตํ•˜๋Š” ์ž…๋ฌธ์ž์šฉ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค. ์ด ๊ฐ•์˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ์›๋ฆฌ, ๊ฒฝ๋Ÿ‰ํ™”(Quantization), ์„œ๋น„์Šค ๋ฐ ํ†ตํ•ฉ ๋ฐ๋ชจ ๊ฐœ๋ฐœ๊นŒ์ง€ ๋‹ค๋ฃจ๋ฉฐ, ์ด๋ก ๊ณผ ์‹ค์Šต์„ ๊ท ํ˜• ์žˆ๊ฒŒ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

(4.6) ์ˆ˜๊ฐ•ํ‰ 30๊ฐœ

์ˆ˜๊ฐ•์ƒ 188๋ช…

๋‚œ์ด๋„ ์ดˆ๊ธ‰

์ˆ˜๊ฐ•๊ธฐํ•œ ๋ฌด์ œํ•œ

์‹ค์Šต ์ค‘์‹ฌ
์‹ค์Šต ์ค‘์‹ฌ
mcp
mcp
์‹ค์Šต ์ค‘์‹ฌ
์‹ค์Šต ์ค‘์‹ฌ
mcp
mcp

๋จผ์ € ๊ฒฝํ—˜ํ•œ ์ˆ˜๊ฐ•์ƒ๋“ค์˜ ํ›„๊ธฐ

๋จผ์ € ๊ฒฝํ—˜ํ•œ ์ˆ˜๊ฐ•์ƒ๋“ค์˜ ํ›„๊ธฐ

4.6

5.0

์–‘๊ทผ์˜

30% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

์ข‹์€ ๊ต์œก์ž…๋‹ˆ๋‹ค.

5.0

ํ™๊ธฐ๋ก

30% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

Vision Language Model์— ๋Œ€ํ•œ ๊ธฐ์ดˆ์ง€์‹์„ ์•Œ ์ˆ˜ ์žˆ์–ด์„œ ์ข‹์•˜์Šต๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค

5.0

๋‚ด์ผ์€ ํ•œ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐˆ๊ฑฐ์•ผ

52% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

์ข‹์€ ๊ฐ•์˜ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜๊ฐ• ํ›„ ์ด๋Ÿฐ๊ฑธ ์–ป์„ ์ˆ˜ ์žˆ์–ด์š”

  • MCP๊ฐ€ ๋ญ”์ง€ ์ดํ•ดํ•˜๊ธฐ

  • ์ง์ ‘ ์†์œผ๋กœ VLM ํŠœ๋‹ ๋ฐ PoC ๋ฐ๋ชจ ๋งŒ๋“ค์–ด๋ณด๊ธฐ

แ„‹แ…ฉแ„„แ…ณ แ„„แ…ตแ„‡แ…ขแ„‚แ…ฅ (1)

ํŒŒ์ธํŠœ๋‹&์ฑ—๋ด‡๊ตฌํ˜„์œผ๋กœ ๋ฐฐ์šฐ๋Š”
์ตœ์‹  ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ์ˆ , VLM

์šฐ๋ฆฌ๋Š” ๋งค์ผ ChatGPT, Gemini, Claude ๊ฐ™์€ AI ์„œ๋น„์Šค๋ฅผ ์‚ฌ์šฉํ•˜์ง€๋งŒ, ๊ทธ๋“ค์ด ์ด๋ฏธ์ง€๋ฅผ ์–ด๋–ป๊ฒŒ '์ดํ•ด'ํ•˜๋Š”์ง€ ๊ถ๊ธˆํ•ดํ•œ ์  ์žˆ๋‚˜์š”? ํ•ต์‹ฌ ๊ธฐ์ˆ ์€ ๋ฐ”๋กœ Vision-Language Model(VLM) ์ž…๋‹ˆ๋‹ค.

์ด ๊ฐ•์˜์—์„œ๋Š” ์ตœ์‹  VLM ๋ชจ๋ธ์ธ LLaVA์™€ Qwen2.5v์„ ์ง์ ‘ ํŒŒ์ธํŠœ๋‹ํ•˜๊ณ , Olama๋กœ ๋กœ์ปฌ ์‹คํ–‰ํ•˜๋ฉฐ MCP(Model Context Protocol)๋ฅผ ํ™œ์šฉํ•ด ๋‚˜๋งŒ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฑ—๋ด‡์„ ๋งŒ๋“ค์–ด ๋ด…๋‹ˆ๋‹ค. CLIP Vision Encoder, Quantization, MCP Server ๊ตฌ์ถ• ๋“ฑ ์‹ค๋ฌด์— ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ ๋„ ๋‹ค๋ฃจ๋ฉฐ, ๋‹จ์ˆœํ•œ API ํ˜ธ์ถœ์„ ๋„˜์–ด์„œ VLM์˜ ๋™์ž‘ ์›๋ฆฌ๋ถ€ํ„ฐ MCP ์—ฐ๋™๊นŒ์ง€ ์ „์ฒด ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ“Œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์˜ ์ง„ํ™” ํ๋ฆ„์„ ํ•œ๋ˆˆ์—

CLIP๋ถ€ํ„ฐ LLaVA OneVision๊นŒ์ง€, VLM์˜ ๋ฐœ์ „๊ณผ์ •๊ณผ ๊ธฐ์ˆ ์  ๋งฅ๋ฝ์„ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“Œ ์ง์ ‘ ๋งŒ๋“œ๋Š” ๋‚˜๋งŒ์˜ VLM ์ฑ—๋ด‡

ํŒŒ์ธํŠœ๋‹๊ณผ ๊ฒฝ๋Ÿ‰ํ™”, Ollama ๋กœ์ปฌ ์‹คํ–‰๊นŒ์ง€-์ง์ ‘ ๋ชจ๋ธ์„ ๊ตฌ์„ฑํ•ด๋ด…๋‹ˆ๋‹ค

๐Ÿ“Œ ์ด๋ก ๊ณผ ์‹ค์Šต์˜ ์™„๋ฒฝํ•œ ๊ท ํ˜•

RunPod ํ™˜๊ฒฝ์—์„œ ์‹ค์ œ๋กœ GPU๋ฅผ ์‚ฌ์šฉํ•ด ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๊ณ  ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค

๐Ÿ“Œ ๋”ฅ๋Ÿฌ๋‹ ๊ฒฝํ—˜์ž๋ผ๋ฉด ๋ˆ„๊ตฌ๋‚˜ OK

์ž…๋ฌธ์ž๋„ ๋”ฐ๋ผ์˜ฌ ์ˆ˜ ์žˆ๋„๋ก ๊ธฐ์ดˆ ๊ฐœ๋…๋ถ€ํ„ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค

๊ฐ•์˜์—์„œ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ๋Š”
5๊ฐ€์ง€ ํฌ์ธํŠธ โœจ

โœ…API ํ˜ธ์ถœ์ด ์•„๋‹Œ, ์ง์ ‘ ๋งŒ๋“œ๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ๊ฒฝํ—˜
๋ชจ๋ธ์„ ๋‹จ์ˆœํžˆ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด์„œ, ์ง์ ‘ ํŠœ๋‹ํ•˜๊ณ  ์—ฐ๊ฒฐํ•˜๋ฉฐ ์™„์„ฑํ•˜๋Š” ์‹ค์ „ ์ค‘์‹ฌ ๊ตฌ์„ฑ์ž…๋‹ˆ๋‹ค.

โœ…VLM ๊ธฐ์ˆ ์˜ ์ง„ํ™” ํ๋ฆ„์„ ๋‹จ๊ณ„๋ณ„๋กœ ์ฒดํ—˜
CLIP โ†’ LLaVA โ†’ LLaVA 1.5 โ†’ OneVision์œผ๋กœ ์ด์–ด์ง€๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ ๋ฐœ์ „ ๊ณผ์ •์„ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒฝํ—˜ํ•ฉ๋‹ˆ๋‹ค.

โœ…์ตœ์‹  ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ์ˆ  ๋ฐ˜์˜
LLaVA OneVision, MCP ๋“ฑ ๊ฐ€์žฅ ์ตœ์‹  ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ํ๋ฆ„์„ ๋‹ด์•˜์Šต๋‹ˆ๋‹ค.

โœ… 10๋‹ฌ๋Ÿฌ๋กœ ์™„์ฃผ ๊ฐ€๋Šฅํ•œ GPU ์‹ค์Šต ์„ค๊ณ„
RunPod ํ™˜๊ฒฝ ๊ธฐ์ค€, ๋ถ€๋‹ด ์—†๋Š” ๋น„์šฉ์œผ๋กœ๋„ ์ „์ฒด ์‹ค์Šต์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

โœ…๊ฐ•์˜๋กœ ์™„์„ฑํ•˜๋Š” ๋‚˜๋งŒ์˜ ํฌํŠธํด๋ฆฌ์˜ค
๊ฐ•์˜ ์ˆ˜๋ฃŒ ์‹œ, ์ง์ ‘ ๋งŒ๋“  ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฑ—๋ด‡ ๊ฒฐ๊ณผ๋ฌผ์„ ๋ณด์œ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๋ถ„๋“ค๊ป˜ ์ถ”์ฒœํ•ด์š”

๐Ÿš€ AI ๊ฐœ๋ฐœ๋กœ ๋ ˆ๋ฒจ์—…ํ•˜๊ณ  ์‹ถ์–ด์š”.
ChatGPT API๋งŒ ์จ๋ดค๋Š”๋ฐ, ์ด์ œ ์ง์ ‘ AI ๋ชจ๋ธ์„ ๋‹ค๋ค„๋ณด๊ณ  ์‹ถ์€ ๊ฐœ๋ฐœ์ž / ํ•™์ƒ

๐Ÿ‘ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์— ๊ด€์‹ฌ์žˆ์–ด์š”.
ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€๋ฅผ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๋Š” AI๋Š” ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ• ๊นŒ? VLM์˜ ์›๋ฆฌ๊ฐ€ ๊ถ๊ธˆํ•˜์‹  ๋ถ„

โšก ๋กœ์ปฌ AI ํ™˜๊ฒฝ ๊ตฌ์ถ•์ด ๊ถ๊ธˆํ•ด์š”.
ํด๋ผ์šฐ๋“œ API ๋น„์šฉ์ด ๋ถ€๋‹ด๋˜์–ด ๋กœ์ปฌ์—์„œ AI ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๊ณ  ์‹ถ์œผ์‹  ๋ถ„

๐Ÿ’ก ์ด๋Ÿฐ ์ˆ˜๊ฐ•์ƒ์—๊ฒŒ ํ•„์š”ํ•œ ๊ฐ•์˜

๐Ÿ˜ค "API๋งŒ ์“ฐ๋Š” ๊ฒŒ ๋‹ต๋‹ตํ•ด์š”"

  • ChatGPT API๋กœ ์„œ๋น„์Šค๋ฅผ ๋งŒ๋“ค์—ˆ์ง€๋งŒ, ๋น„์šฉ๋„ ๋ถ€๋‹ด๋˜๊ณ  ์ œ์•ฝ๋„ ๋งŽ์•„์„œ ๋‹ต๋‹ตํ•˜์‹  ๋ถ„

  • ๋ธ”๋ž™๋ฐ•์Šค ๊ฐ™์€ AI ๋ชจ๋ธ ๋‚ด๋ถ€๊ฐ€ ๊ถ๊ธˆํ•ด์„œ ์ง์ ‘ ๋งŒ์ ธ๋ณด๊ณ  ์‹ถ์œผ์‹  ๋ถ„

๐Ÿ’ธ "AI ์„œ๋น„์Šค ์šด์˜๋น„๊ฐ€ ๋„ˆ๋ฌด ๋น„์‹ธ์š”"

  • OpenAI Vision API ํ˜ธ์ถœ ๋น„์šฉ์ด ๋ถ€๋‹ด๋˜์–ด ์ž์ฒด ๋ชจ๋ธ ๊ตฌ์ถ•์„ ๊ณ ๋ ค ์ค‘์ธ ์Šคํƒ€ํŠธ์—… ๊ฐœ๋ฐœ์ž

  • ๋Œ€๋Ÿ‰์˜ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ์„œ๋น„์Šค๋ฅผ ๊ธฐํš ์ค‘์ธ ๋ถ„

๐Ÿš€ "๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI ์ „๋ฌธ๊ฐ€๊ฐ€ ๋˜๊ณ  ์‹ถ์–ด์š”"

  • AI ๊ฐœ๋ฐœ์ž๋กœ ์ปค๋ฆฌ์–ด๋ฅผ ๋ฐœ์ „์‹œํ‚ค๊ณ  ์‹ถ์ง€๋งŒ ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ LLM๋งŒ ๋‹ค๋ค„๋ณธ ๋ถ„

  • ํฌํŠธํด๋ฆฌ์˜ค์— ์ฐจ๋ณ„ํ™”๋œ ํ”„๋กœ์ ํŠธ๋ฅผ ์ถ”๊ฐ€ํ•˜๊ณ  ์‹ถ์€ ์ทจ์—… ์ค€๋น„์ƒ

๐Ÿค” "VLM์ด ์ •ํ™•ํžˆ ๋ญ”์ง€ ๋ชจ๋ฅด๊ฒ ์–ด์š”"

  • AI ํŠธ๋ Œ๋“œ๋Š” ๋”ฐ๋ผ๊ฐ€๊ณ  ์‹ถ์ง€๋งŒ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ์ด ๋ญ”์ง€, VLM์ด ๋ญ”์ง€ ์ •ํ™•ํžˆ ์ดํ•ดํ•˜์ง€ ๋ชปํ•˜์‹  ๋ถ„

  • ์ด๋ฏธ์ง€์™€ ํ…์ŠคํŠธ๋ฅผ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๋Š” AI์˜ ์›๋ฆฌ๊ฐ€ ๊ถ๊ธˆํ•˜์‹  ๋ถ„

์ˆ˜๊ฐ• ํ›„์—๋Š”

  • CLIP, LLaVA ์‹œ๋ฆฌ์ฆˆ์˜ ๋™์ž‘ ์›๋ฆฌ๋ฅผ ์™„๋ฒฝํžˆ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์–ด์š”. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI๋„ ๋” ์ด์ƒ ๋ธ”๋ž™๋ฐ•์Šค๊ฐ€ ์•„๋‹ˆ๊ฒŒ ๋ผ์š”.

  • Ollama์™€ RunPod์„ ํ™œ์šฉํ•œ ์‹ค์ „ ํ™˜๊ฒฝ์—์„œ VLM์„ ํŒŒ์ธํŠœ๋‹ํ•˜๊ณ  ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ์–ด์š”.

  • Quantization ๊ธฐ๋ฒ•์œผ๋กœ ๊ฑฐ๋Œ€ํ•œ ๋ชจ๋ธ์„ ๊ฒฝ๋Ÿ‰ํ™”ํ•ด์„œ ๊ฐœ์ธ PC์—์„œ๋„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ผ์š”.

  • MCP(Model Context Protocol)๋ฅผ ํ™œ์šฉํ•ด ์—ฌ๋Ÿฌ AI ๋„๊ตฌ๋“ค์„ ํ†ตํ•ฉํ•œ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ์–ด์š”.

  • ๋‚˜๋งŒ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฑ—๋ด‡์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋๊นŒ์ง€ ์ง์ ‘ ๋งŒ๋“ค ์ˆ˜ ์žˆ๊ฒŒ ๋ผ์š”.

๐Ÿ’ก ์ˆ˜๊ฐ• ํ›„ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๊ตฌ์ฒด์  ๋ณ€ํ™”

๐ŸŽฏ ์ฆ‰์‹œ ํ™œ์šฉ ๊ฐ€๋Šฅํ•œ ์‹ค๋ฌด ์Šคํ‚ฌ

์ˆ˜๊ฐ• ์™„๋ฃŒ ํ›„์—๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹ค์ „ ํ”„๋กœ์ ํŠธ๋ฅผ ํ˜ผ์ž์„œ๋„ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋‚˜๋งŒ์˜ VLM ์„œ๋น„์Šค: ํŠน์ • ๋„๋ฉ”์ธ(์˜๋ฃŒ, ๊ต์œก, ์‡ผํ•‘ ๋“ฑ)์— ํŠนํ™”๋œ ์ด๋ฏธ์ง€ ๋ถ„์„ ์ฑ—๋ด‡

  • ๋กœ์ปฌ AI ์›Œํฌํ”Œ๋กœ์šฐ: MCP๋ฅผ ํ™œ์šฉํ•ด ์—ฌ๋Ÿฌ AI ๋„๊ตฌ๋“ค์ด ํ˜‘์—…ํ•˜๋Š” ์ž๋™ํ™” ์‹œ์Šคํ…œ

  • ๋น„์šฉ ํšจ์œจ์  AI ์„œ๋น„์Šค: API ์˜์กด๋„๋ฅผ ์ค„์ด๊ณ  ์ž์ฒด ๋ชจ๋ธ๋กœ ์šด์˜ํ•˜๋Š” ์„œ๋น„์Šค

๐Ÿ“ˆ ์ปค๋ฆฌ์–ด ๋ฐœ์ „์„ ์œ„ํ•œ ํฌํŠธํด๋ฆฌ์˜ค

  • GitHub ์ €์žฅ์†Œ: ์ „์ฒด ์‹ค์Šต ์ฝ”๋“œ์™€ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์„ ์ •๋ฆฌํ•œ ์™„์„ฑ๋„ ๋†’์€ ๋ ˆํฌ์ง€ํ† ๋ฆฌ

  • ๊ธฐ์ˆ  ๋ธ”๋กœ๊ทธ ์†Œ์žฌ: VLM ํŒŒ์ธํŠœ๋‹ ๊ณผ์ •๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ •๋ฆฌํ•œ ๊ธฐ์ˆ  ํฌ์ŠคํŒ… ์ž‘์„ฑ ๊ฐ€๋Šฅ

  • ๋ฉด์ ‘ ๊ฒฝํ—˜๋‹ด: "์ง์ ‘ VLM์„ ํŒŒ์ธํŠœ๋‹ํ•ด๋ณธ ๊ฒฝํ—˜"์œผ๋กœ ์ฐจ๋ณ„ํ™”๋œ ๋ฉด์ ‘ ์Šคํ† ๋ฆฌ

๐Ÿง  ๊นŠ์ด ์žˆ๋Š” ์ดํ•ด์™€ ์‘์šฉ๋ ฅ

๋‹จ์ˆœํ•œ ์‚ฌ์šฉ๋ฒ•์„ ๋„˜์–ด์„œ:

  • VLM์˜ ๋‚ด๋ถ€ ๋™์ž‘ ์›๋ฆฌ๋ฅผ ์™„์ „ํžˆ ์ดํ•ดํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ชจ๋ธ๋„ ๋น ๋ฅด๊ฒŒ ํ•™์Šต ๊ฐ€๋Šฅ

  • Quantization, GGUF ๋ณ€ํ™˜ ๋“ฑ ๋ชจ๋ธ ์ตœ์ ํ™” ๊ธฐ๋ฒ•์„ ๋‹ค๋ฅธ ํ”„๋กœ์ ํŠธ์—๋„ ์‘์šฉ

  • MCP ์ƒํƒœ๊ณ„๋ฅผ ํ™œ์šฉํ•œ AI ์›Œํฌํ”Œ๋กœ์šฐ ์„ค๊ณ„ ๋Šฅ๋ ฅ

์ด๋Ÿฐ ๋‚ด์šฉ์„ ๋ฐฐ์›Œ์š”.

๐Ÿง  VLM ํ•ต์‹ฌ ์›๋ฆฌ: CLIP์—์„œ LLaVA OneVision๊นŒ์ง€
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI๋Š” ์–ด๋–ป๊ฒŒ ์ด๋ฏธ์ง€๋ฅผ '์ดํ•ด'ํ• ๊นŒ์š”? CLIP Vision Encoder์˜ ์›๋ฆฌ๋ถ€ํ„ฐ ์ตœ์‹  LLaVA OneVision๊นŒ์ง€, VLM์˜ ์ง„ํ™” ๊ณผ์ •์„ ๋‹จ๊ณ„๋ณ„๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”ง ์‹ค์ „ ํŒŒ์ธํŠœ๋‹: ๋‚˜๋งŒ์˜ VLM ๋งŒ๋“ค๊ธฐ
RunPod GPU ํ™˜๊ฒฝ์—์„œ LLaVA ๋ชจ๋ธ์„ ์ง์ ‘ ํŒŒ์ธํŠœ๋‹ํ•ด ๋ด…๋‹ˆ๋‹ค. Jupyter Notebook๊ณผ HuggingFace Accelerate๋ฅผ ํ™œ์šฉํ•œ ํšจ์œจ์ ์ธ ํ›ˆ๋ จ ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค.

โšก ๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™”: Quantization & GGUF ๋ณ€ํ™˜
๊ฑฐ๋Œ€ํ•œ VLM์„ ๊ฐœ์ธ PC์—์„œ๋„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก GGUF ํฌ๋งท์œผ๋กœ ๋ณ€ํ™˜ํ•˜๊ณ  Quantization์„ ์ ์šฉํ•˜๋Š” ์‹ค์ „ ๊ธฐ๋ฒ•์„ ์ตํž™๋‹ˆ๋‹ค.

๐Ÿ”— MCP ํ†ตํ•ฉ: AI ๋„๊ตฌ๋“ค์˜ ํ˜‘์—…
Model Context Protocol์„ ํ™œ์šฉํ•ด ์—ฌ๋Ÿฌ AI ๋ชจ๋ธ๊ณผ ๋„๊ตฌ๋“ค์„ ํ•˜๋‚˜์˜ ์›Œํฌํ”Œ๋กœ์šฐ๋กœ ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค.

์ด ๊ฐ•์˜๋ฅผ ๋งŒ๋“  ์‚ฌ๋žŒ

  • 2016 ~ ํ˜„์žฌ: NLP & LLM ๊ฐœ๋ฐœ ์‹ค๋ฌด์ž (๋Œ€๊ธฐ์—… N์‚ฌ ~ S์‚ฌ ๊ทผ๋ฌด)

์ˆ˜๊ฐ• ์ „ ์ฐธ๊ณ  ์‚ฌํ•ญ

์‹ค์Šต ํ™˜๊ฒฝ

  • ๊ฐ•์˜๋Š” MacOS ๊ธฐ์ค€์œผ๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์œˆ๋„์šฐ ๋จธ์‹ ์ด๋ผ๋ฉด docker๊ฐ€ ์„ค์น˜๋˜์–ด ์žˆ๋‹ค๋ฉด ๋Œ€๋ถ€๋ถ„ ๋”ฐ๋ผ์˜ค์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๊ฐ•์˜์—์„œ๋Š” cursor์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. vscode ๋ฒ„์ „๋„ ๋ฌด๋ฆฌ์—†์ด ๋”ฐ๋ผ์˜ค์‹ค ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

  • ํด๋ผ์šฐ๋“œ ํ™˜๊ฒฝ

    • RunPod: GPU ์ธ์Šคํ„ด์Šค ๋Œ€์—ฌ ์„œ๋น„์Šค, H100 ๋˜๋Š” A100 ์‚ฌ์šฉ

    • ์˜ˆ์ƒ ๋น„์šฉ: ์ „์ฒด ์‹ค์Šต ๊ธฐ์ค€ 10๋‹ฌ๋Ÿฌ

    • ์žฅ์ : ๋ณต์žกํ•œ ํ™˜๊ฒฝ ์„ค์ • ์—†์ด ๋ฐ”๋กœ ์‹ค์Šต ๊ฐ€๋Šฅ

    • โš  ์œ ์˜์‚ฌํ•ญ

      • RunPod ๊ณ„์ • ์ƒ์„ฑ ๋ฐ ๊ฒฐ์ œ ์นด๋“œ ๋“ฑ๋ก ํ•„์š”

ํ•™์Šต ์ž๋ฃŒ

  • ์ฒจ๋ถ€ํ•˜๋Š” PDF ๋ฐ ์†Œ์Šค ์ฝ”๋“œ๋ฅผ ํ™•์ธํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค

์„ ์ˆ˜ ์ง€์‹ ๋ฐ ์œ ์˜์‚ฌํ•ญ

  • LLM ๊ด€๋ จ ์ง€์‹ (์ด์ „ LLM 101 ๊ฐ•์˜ ์ฐธ๊ณ )

  • ๊ธฐ๋ณธ์ ์ธ Python ๋ฌธ๋ฒ• (ํด๋ž˜์Šค, ํ•จ์ˆ˜, ๋ชจ๋“ˆ ์‚ฌ์šฉ)

  • ๋”ฅ๋Ÿฌ๋‹/๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ์ดˆ ๊ฐœ๋… (์‹ ๊ฒฝ๋ง, ํ›ˆ๋ จ, ์ถ”๋ก  ๋“ฑ)

  • GPU ํ™˜๊ฒฝ์—์„œ์˜ ๋ชจ๋ธ ํ›ˆ๋ จ ๊ฒฝํ—˜์ด ์žˆ์œผ๋ฉด ์ข‹์Šต๋‹ˆ๋‹ค (ํ•„์ˆ˜๋Š” ์•„๋‹˜)

  • ํ„ฐ๋ฏธ๋„/๋ช…๋ น์–ด ์‚ฌ์šฉ์— ์ต์ˆ™ํ•˜๋ฉด ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค

์ด๋Ÿฐ ๋ถ„๋“ค๊ป˜
์ถ”์ฒœ๋“œ๋ ค์š”

ํ•™์Šต ๋Œ€์ƒ์€
๋ˆ„๊ตฌ์ผ๊นŒ์š”?

  • Multimodal, VLM์ด ์ฒ˜์Œ์ธ ๋ถ„

  • MCP ๊ธฐ๋ฐ˜ ๋ฐ๋ชจ๋ฅผ ๋งŒ๋“ค์–ด ๋ณด๊ณ  ์‹ถ์€ ์‚ฌ๋žŒ

์„ ์ˆ˜ ์ง€์‹,
ํ•„์š”ํ• ๊นŒ์š”?

  • LLM ๊ธฐ์ดˆ

์•ˆ๋…•ํ•˜์„ธ์š”
๊ฟˆ๊พธ๋Š”๋ฒ”๋ธ”๋น„์ž…๋‹ˆ๋‹ค.

415

๋ช…

์ˆ˜๊ฐ•์ƒ

59

๊ฐœ

์ˆ˜๊ฐ•ํ‰

4

๊ฐœ

๋‹ต๋ณ€

4.4

์ 

๊ฐ•์˜ ํ‰์ 

2

๊ฐœ

๊ฐ•์˜

๐Ÿ“ฑcontact: dreamingbumblebee@gmail.com

์ปค๋ฆฌํ˜๋Ÿผ

์ „์ฒด

23๊ฐœ โˆ™ (2์‹œ๊ฐ„ 52๋ถ„)

ํ•ด๋‹น ๊ฐ•์˜์—์„œ ์ œ๊ณต:

์ˆ˜์—…์ž๋ฃŒ
๊ฐ•์˜ ๊ฒŒ์‹œ์ผ: 
๋งˆ์ง€๋ง‰ ์—…๋ฐ์ดํŠธ์ผ: 

์ˆ˜๊ฐ•ํ‰

์ „์ฒด

30๊ฐœ

4.6

30๊ฐœ์˜ ์ˆ˜๊ฐ•ํ‰

  • ํ™๊ธฐ๋ก๋‹˜์˜ ํ”„๋กœํ•„ ์ด๋ฏธ์ง€
    ํ™๊ธฐ๋ก

    ์ˆ˜๊ฐ•ํ‰ 3

    โˆ™

    ํ‰๊ท  ํ‰์  4.7

    5

    30% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

    Vision Language Model์— ๋Œ€ํ•œ ๊ธฐ์ดˆ์ง€์‹์„ ์•Œ ์ˆ˜ ์žˆ์–ด์„œ ์ข‹์•˜์Šต๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค

    • MLE๋‹˜์˜ ํ”„๋กœํ•„ ์ด๋ฏธ์ง€
      MLE

      ์ˆ˜๊ฐ•ํ‰ 2

      โˆ™

      ํ‰๊ท  ํ‰์  5.0

      5

      61% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

      ๋Œ€๋žต์ ์œผ๋กœ ๊ฐœ๋… ์‚ดํŽด๋ณด๊ณ  ๊ฐ„๋‹จํ•œ ๋ฐ๋ชจ ๋งŒ๋“ค์–ด๋ณด๊ธฐ์— ์ข‹์€๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ดˆ๋ฐ˜์— ๋น ๋ฅด๊ฒŒ ๊ฐœ๋…์žก๋Š” ์šฉ์œผ๋กœ๋Š” ๋‚˜์˜์ง€ ์•Š๋„ค์š”

      • ๋‚ด์ผ์€ ํ•œ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐˆ๊ฑฐ์•ผ๋‹˜์˜ ํ”„๋กœํ•„ ์ด๋ฏธ์ง€
        ๋‚ด์ผ์€ ํ•œ๊ฑธ์Œ ๋” ๋‚˜์•„๊ฐˆ๊ฑฐ์•ผ

        ์ˆ˜๊ฐ•ํ‰ 31

        โˆ™

        ํ‰๊ท  ํ‰์  4.8

        ์ˆ˜์ •๋จ

        5

        52% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

        ์ข‹์€ ๊ฐ•์˜ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

        • ์ตœ์˜์„ ๋‹˜์˜ ํ”„๋กœํ•„ ์ด๋ฏธ์ง€
          ์ตœ์˜์„ 

          ์ˆ˜๊ฐ•ํ‰ 12

          โˆ™

          ํ‰๊ท  ํ‰์  4.8

          5

          100% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

          ํ•ต์‹ฌ์ ์ธ ๋‚ด์šฉ์€ ์งง์€ ์‹œ๊ฐ„์— ์ž˜ ์„ค๋ช…ํ•˜์‹œ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

          • ์–‘๊ทผ์˜๋‹˜์˜ ํ”„๋กœํ•„ ์ด๋ฏธ์ง€
            ์–‘๊ทผ์˜

            ์ˆ˜๊ฐ•ํ‰ 1

            โˆ™

            ํ‰๊ท  ํ‰์  5.0

            5

            30% ์ˆ˜๊ฐ• ํ›„ ์ž‘์„ฑ

            ์ข‹์€ ๊ต์œก์ž…๋‹ˆ๋‹ค.

            ๋น„์Šทํ•œ ๊ฐ•์˜

            ๊ฐ™์€ ๋ถ„์•ผ์˜ ๋‹ค๋ฅธ ๊ฐ•์˜๋ฅผ ๋งŒ๋‚˜๋ณด์„ธ์š”!

            ์—ฐ๊ด€ ๋กœ๋“œ๋งต

            ๊ฐ•์˜๊ฐ€ ํฌํ•จ๋œ ๋กœ๋“œ๋งต์œผ๋กœ ํ•™์Šตํ•ด ๋ณด์„ธ์š”!

            ์›” โ‚ฉ15,400

            5๊ฐœ์›” ํ• ๋ถ€ ์‹œ

            โ‚ฉ77,000