๊ฐ์ธํ ์ถ์ฒ์์คํ
๊ตฌํ โ
๊ฑฐ์น์ฝ๋ฉ๊ณผ ํจ๊ป ๊ฑฐ์น ์ง๋ง ์ ์ตํ๊ฒ!
์ฑ๊ณตํ๋ ์๋น์ค์ ๋น๊ฒฐ
์ถ์ฒ ์์คํ
์๊ณ ๋ฆฌ์ฆ ๐จโ๐ป
๋ทํ๋ฆญ์ค, ์๋ง์กด, ์ ํ๋ธ, ์คํฌํฐํ์ด ๋ฑ
์ธ๊ณ์ ์ธ ์ ๋ช
์๋น์ค๋ฅผ ๋น๋กฏํด
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ํ์ฉํ ์๋น์ค๊ฐ
์ ์ ๋ ๋์ด๋๊ณ ์์ต๋๋ค.
๊ทธ๋ฐ๋ฐ...
ํน์ ๋ด ์๊ธฐ ๊ฐ์ง ์์ผ์ ๊ฐ์?
โ์ ๊ฐ ๊ณผ์ฐ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊ฐ๋
์ ๋ฐ๋ก์ก์ ์ ์์๊น์?โ
โ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ, ๊ฐ๋
์ ์๊ฒ ๋๋ฐ... ๊ทธ๋์ ์ด๋ป๊ฒ ๊ตฌํํ์ฃ ?โ
๐๐
์ถ์ฒ ์์คํ
๐
์ฝ๊ณ ์ง๊ด์ ์ธ ํ์ด์ฌ์ผ๋ก!
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ํ์ฉํ ์๋น์ค๊ฐ ์ ์ ๋ง์์ง๋ฉด์, ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ํ์ตํ๊ธธ ์ํ๋ ๋ถ๋ค๋ ๊ณ์ํด์ ๋๊ณ ์์ต๋๋ค. ์ด์ ๋ฐ๋ง์ถฐ <Python์ ์ด์ฉํ ๊ฐ์ธํ ์ถ์ฒ์์คํ
>์์๋ ์ดํดํ๊ธฐ ์ฝ๊ณ ์ง๊ด์ ์ธ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด ํ์ด์ฌ(Python)์ ํ์ฉํด ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ ํํ ๊ฐ๋
๊ณผ ์๋ฆฌ๋ฅผ ์ค๋ช
๋๋ฆฌ๊ณ ์ ํฉ๋๋ค.
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ, ์ ํ์ด์ฌ(Python)์ผ๊น์?
์ถ์ฒ ์์คํ
์ ๋ฐฐ์ฐ๊ณ ์ถ์ ๋ถ, ์ค๋ฌด์ ๋ง๋ ๊ตฌํ ๋ฅ๋ ฅ๊น์ง ๊ธฐ๋ฅด๊ณ ์ถ์ ๋ง์ ๋ถ๋ค๊ป ์ ์๋ฏธํ ์๊ฐ์ด ๋์์ผ๋ฉด ์ข๊ฒ ์ต๋๋ค ๐
๐ป ์ ์ ์ง์์ ํ์ธํด์ฃผ์ธ์!
- ๊ฐ์๋ฅผ ์๊ฐํ๊ธฐ ์ํด์๋ Python ์ธ์ด ๋ฐ ๋ฐ Numpy(๋ํ์ด), Pandas(ํ๋ค์ค), Keras(์ผ๋ผ์ค) ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ํ ๊ธฐ๋ณธ ์ดํด๊ฐ ํ์ํฉ๋๋ค.
๋จ๋ค๋ฅด๊ฒ ๋ฐฐ์ฐ๋
์ถ์ฒ ์์คํ
์ ์ธ๊ณ ๐
๊ฑฐ์น ์ง๋ง ์ ๋ง ์ ์ตํ!
๋ฐ์ดํฐ ๋ถ์๊ฐ ๊ฑฐ์น์ฝ๋ฉ์
๋๋ค.
์๋
ํ์ธ์! ์ ๋ ํ์ฌ "๋ค์นด๋ผ ์ค ํ ๊ณณ"์์ ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ก ์ผํ๋ ๊ฑฐ์น์ฝ๋ฉ์
๋๋ค.
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊ฐ๋
์ ๋ฐ๋ก์ก์ ์ ์์์ง ๊ณ ๋ฏผํ์
จ๋์? ์ฑ
์ ๋ณผ ๋ ์๊ฒ ๋๋ฐ, ๋ง์ ์ค์ ๋ก ์๊ณ ๋ฆฌ์ฆ์ ๊ตฌํํ๋ ค๋ ๋ง๋งํ๊ฒ๋ง ๋๊ปด์ง์๋์?
์ด ๊ฐ์๋ฅผ ํตํด, ๊ฐ๋
๊ณผ ๋์ ์๋ฆฌ๋ฅผ ์ ํํ ์ค๋ช
ํจ์ผ๋ก์จ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐํ์ ํ์คํ๊ฒ ๋ฐ๋ก์ก์๋๋ฆฌ๋ ค๊ณ ํฉ๋๋ค. ๋จ์ ๊ฐ๋
์ค๋ช
์ผ๋ก ๋๋์ง ์๊ณ , ๊ตฌ์ฒด์ ์ธ ๋์ ์๋ฆฌ๊น์ง ํจ๊ป ์ฝ๋ฉํ๋ฉด์ ์ค์ ๊ตฌํ์ ๋ํ ํ์ ๊น์ง ๋๋ฆด ์ ์๋๋ก ๊ฐ์๋ฅผ ๊ตฌ์ฑํ์ต๋๋ค.
๋ฐ์ดํฐ ๋ถ์๊ฐ, ๊ฑฐ์น์ฝ๋ฉ์ ๐จโ๐ป
ํ์ฌ "๋ค์นด๋ผ ์ค ํ ๊ณณ"์์ ํ์ด์ฌ ๋ฐ ์๊ฐํ ํด(Tableau)์ ํ์ฉํด ๋ฐ์ดํฐ ์์ง, ๊ฐ๊ณต, ๋ถ์, ์์ธก, ์๊ฐํ, ์
๋ฌด ์๋ํ๋ฅผ ํ๊ณ ์์ต๋๋ค.
์ฃผ์ ์ด๋ ฅ
- ๊ณ ๋ ค๋ํ๊ต ํต๊ณํ๊ณผ ํ์ฌ (์กธ์
)
- ๊ณ ๋ ค๋ํ๊ต ๋ํ์ ๋น
๋ฐ์ดํฐ์ตํฉํ๊ณผ (์ฌํ)
- QS ์ธ๊ณ๋ํํ๊ฐ ํ๊ฐ์์
- ๊ณ ๋ ค๋ํ๊ต SW์ค์ฌ๋ํ ์ธ๊ณต์ง๋ฅ ์ฌํ ์๋ฃ
- ๊ณ ๋ ค๋ํ๊ต KUCC(์ปดํจํฐ ๋์๋ฆฌ) ์ธ์
์ฅ
- ๊ณ ๋ ค๋ํ๊ต ํ๊ณผ ์์ 5ํ, ์ ์ฒด ์์ 1ํ
- ๋น
๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ ์๊ฒฉ์ฆ
- ๋น
๋ฐ์ดํฐ๋ถ์ ์ค์ ๋ฌธ๊ฐ(ADSP) ์๊ฒฉ์ฆ)
- ๋น
๋ฐ์ดํฐ ๋ถ์ ๋ฐ ๊ฐ๋ฐ ๋ธ๋ก๊ทธ ์ด์
- ์ธ๊ณต์ง๋ฅ ๊ฐ์ ์ ํ๋ธ ์ด์
๋ฉํ ๋ง ์งํ
- ๋ฐ์ดํฐ ๋ถ์ ์ง๋ฌด๋ฅผ ๊ฟ๊พธ๋ ํ์๋ค์ ์ํ ํจ์จ์ ๊ณต๋ถ๋ฒ
- ๋ฐ์ดํฐ ๋ถ์ ํ์
์ ์๋ ์ฃผ๋์ด ๋ถ์๊ฐ๋ฅผ ์ํ ์๋ด
- ํ์
์์ IT์ง๊ตฐ์ด ์๋์ง๋ง, IT ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋ณธ์ธ ์
๋ฌด์ ์ ์ฉํ๊ณ ์ถ์ ๋ถ
์ ์ง์์ ํตํด
ํจ๊ป ๋ง๋ค์ด๊ฐ๋ ๊ฐ์๊ฐ
๋์์ผ๋ฉด ์ข๊ฒ ์ต๋๋ค.
๋ชจ๋ ์ผ์๋ ์์์ด ๊ฐ์ฅ ์ค์ํฉ๋๋ค. ํ์ตํ์๋ฉด์ ๊ถ๊ธํ์ ๋ด์ฉ์ด ์๋ค๋ฉด [์ง๋ฌธ/๋ต๋ณ] ์ ํตํด ๋ฌธ์ํด์ฃผ์ธ์. ๋ฉํ ๋ง๋ ์งํํ๊ณ ์์ผ๋, ๋ฐ์ดํฐ ๋ถ์์ ๊ด์ฌ์ด ์๋ ๋ถ๋ค๊ป ๋ง์ ๋์์ด ๋๊ณ ์ถ์ต๋๋ค. ๐
ํ์ ์ถ์ข
์ ๋ถํํฉ๋๋ค!
์ด ๊ฐ์๊ฐ ๋จ๋ค๋ฅธ ์ด์ ๐
๋จ์ ๊ฐ๋
์ค๋ช
์์ฃผ ๋ง์ฐํ ๊ฐ์?
โข ์ธํฐ๋ท์ ๋๋ ค์๋ ์๋ฃ๋
๊ฐ์๊ฐ ๋ณ๋ฐ ๋ค๋ฅธ ๊ฒ ์๋ ๊ฒ ๊ฐ์์.
โข ๊ฐ๋
์ค๋ช
์ ์ข์๋ฐ,
๊ทธ๋์ ์ค์ ๊ตฌํ์ ์ ํํ ์ด๋ป๊ฒ ํ์ฃ ?
โข ์ฌ์ฉํ๋ ์ธ์ด ์์ฒด ๋์ด๋๊ฐ ๋๋ฌด ์ด๋ ค์์.
์ฒด๊ณ์ ์ปค๋ฆฌํ๋ผ, ์ค์ต ์์ฃผ ์ค์ ๊ฐ์!
โข ๋จ์ ๊ฐ๋
์ค๋ช
์ด ์๋
์๋ฆฌ ๋ฐ ์ค์ต ์์ฃผ์ ์ค์ ๊ฐ์์์.
โข ๋จ์ํ ์น์์ ์๋ฃ๋ฅผ ๋ชจ์ ๊ฐ์๊ฐ ์๋๋ผ,
๊ถ์์๋ ์ฐธ๊ณ ์์ ์ ์ ๋ฆฌํด์ ์ฎ์์ด์.
โข ์ฝ๊ณ ๋น ๋ฅด๊ฒ ๋ฐฐ์ฐ๋ ํ์ด์ฌ์ ํ์ฉํ์ด์.
1๏ธโฃ ๋จ์ ๊ฐ๋
์ค๋ช
์ด ์๋, ์๋ฆฌ+์ค์ต ์์ฃผ์ ์ค์ ๊ฐ์
์ด๋ฏธ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๋จ์ ๊ฐ๋
์ค๋ช
์ ๋ง์ ์ฌ์ดํธ์ ๋๋ ค ์์ต๋๋ค. ํ์ง๋ง ์๋ฌด๋ฆฌ ์ข์ ๊ฐ๋
์ค๋ช
์ผ์ง๋ผ๋ ์ค์ ์ ํํ ๊ตฌํ๊น์ง ์ด๋ฅด์ง ๋ชปํ๋ฉด ์์ฉ์ด ์๊ธฐ ๋ง๋ จ์
๋๋ค.
์ด๋ฒ ๊ฐ์์์๋ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋
์ ์ถฉ์คํ ์๋ ค๋๋ฆฌ๋ ๊ฒ์ ๋ฌผ๋ก , ํ์
์์ ์ถ์ฒ ์์คํ
์ ๋์
ํ๊ธฐ ์ํ ๋
ธํ์ฐ๊น์ง ํํํ๊ฒ ์๋ ค๋๋ฆฝ๋๋ค.
2๏ธโฃ ์ฝ๊ณ ๋น ๋ฅด๊ฒ ๋ฐฐ์ฐ๋ Python์ ํ์ฉํ ๊ฐ์
๋ค๋ฅธ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ๋นํด ๋น ๋ฅด๊ฒ ๋ฐฐ์ธ ์ ์๊ณ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์ ํนํ๋ ์ธ์ด์ธ Python์ ํ์ฉํ์ฌ ๊ฐ์๊ฐ ์งํ๋ฉ๋๋ค. ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ดํด๋ฟ๋ง ์๋๋ผ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ ๊ตฌ์ถ์ ํ์ํ ๋ฐ์ดํฐ ์์ง๋์ด๋ง๊น์ง ํจ๊ป ๋ฐฐ์ธ ์ ์๋๋ก ๊ฐ์๋ฅผ ๊ตฌ์ฑํ์์ต๋๋ค.
3๏ธโฃ ์ฒด๊ณ์ ์ธ ์ปค๋ฆฌํ๋ผ์ผ๋ก ์ ํํ ์ดํด๊น์ง
Python์ ์ด์ฉํ ๊ฐ์ธํ ์ถ์ฒ์์คํ
(๋์์ถํ์ฒญ๋, ์์ผ ์ )
๋จ์ํ ์ฌ๋ฌ ์ฌ์ดํธ์ ๋์๋ค๋๋ ์ง์์ ๋์ถฉ ๋ชจ์์ ๊ตฌ์ฑํ ๊ฐ์๊ฐ ์๋๋๋ค. ๊ถ์์๋ ์ฐธ๊ณ ์์ ์ ์ ๋ฆฌํ ๋ด์ฉ์ ๊ธฐ๋ฐ์ผ๋ก, ์ฒด๊ณ์ ์ผ๋ก ๊ฐ์ ์ปค๋ฆฌํ๋ผ์ ๊ตฌ์ฑํ์์ต๋๋ค.
ํ์ต ๋ด์ฉ์
ํ์ธํด๋ณด์ธ์ ๐
์ด ๊ฐ์์์๋ ๐ป
- ์ฃผ๋ก ๊ฐ์ธํ ์ถ์ฒ ๊ธฐ์ ์ ์ ๋ฐ์ ์ธ ๋ด์ฉ์ ๋ค๋ฃน๋๋ค.
- ๊ทธ์ค์์๋ ํนํ ์ฐ์๊ฐ์ ์ฌ์ฉํ๋ ๊ฐ์ธํ ์ถ์ฒ ๊ธฐ์ ์ ๋ค๋ฃน๋๋ค.
- ํ์
ํํฐ๋ง(Collaborative Filtering), ํ๋ ฌ ์์ธํ(Maxtrix Factorization), ๋ฅ๋ฌ๋(Deep Learning) ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ๋ค์์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฐํฉํ ํ์ด๋ธ๋ฆฌ๋(Hybrid) ์ถ์ฒ ์์คํ
๋ฑ์ ๋ํด์๋ ์ค๋ช
ํฉ๋๋ค.
์ค๋ฆฌ์ํ
์ด์
์ด๋ฒ ๊ฐ์์ ๋ชฉ์ ์ ์ฃผ์ ๊ฐ์ธํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์๋์๋ฆฌ๋ฅผ ์ดํดํ๋ ๋ฐ ์์ต๋๋ค. ๊ฐ์์ ๋ชฉ์ ๊ณผ ์๊ฐ๋ฅผ 5๋ถ ์ ๋์ OT ์์์ ํตํด ์ ๋ฆฌํ์์ผ๋, [๊ฐ์ ๋ฏธ๋ฆฌ๋ณด๊ธฐ] ๋ฅผ ํตํด ํ์ธํด ์ฃผ์ธ์!
์ถ์ฒ ์์คํ
์๊ฐ
์ฌ์ฉ์์ ๊ณผ๊ฑฐ ํ๋ ๋ฐ์ดํฐ๋ ๋ค๋ฅธ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ฌ์ฉ์์๊ฒ ํ์ํ ์ ๋ณด๋ ์ ํ์ ๊ณจ๋ผ์ ์ ์ํด ์ฃผ๋ ์ถ์ฒ ์์คํ
์ ๊ฐ๋
๊ณผ ์ฌ๋ฌ ๊ธฐ์ , ๊ทธ๋ฆฌ๊ณ ๊ทธ ๋ฐ์ ๊ณผ์ ์ ๋ํด ์๊ฐํด๋๋ฆฝ๋๋ค.
- ์ฃผ์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ
- ์ถ์ฒ ์์คํ
์ ์ฉ ์ฌ๋ก
๊ธฐ๋ณธ์ ์ธ ์ถ์ฒ ์์คํ
์์ผ๋ก์ ์ด๋ก ๊ณผ ์ค์ต์ ๋ฐฐ์ฐ๊ธฐ ์ํ ๊ธฐ๋ณธ์ ์ธ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๊ณ ์ดํดํ๋ ๊ณผ์ ์
๋๋ค. ์ถ์ฒ ์์คํ
์ ๊ธฐ๋ณธ ๋์ ์๋ฆฌ๋ฅผ ์๊ฐํด ๋๋ฆฝ๋๋ค.
- ๋ฐ์ดํฐ ์ฝ๊ธฐ
- ์ธ๊ธฐ์ ํ ๋ฐฉ์
- ์ถ์ฒ ์์คํ
์ ์ ํ๋ ์ธก์
- ์ฌ์ฉ์ ์ง๋จ๋ณ ์ถ์ฒ
ํ์
ํํฐ๋ง ์ถ์ฒ ์์คํ
์ ์ฌ๋ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฃจ์ด์ง ํ์
ํํฐ๋ง(CF)์ ๋ํ ๊ฐ๋
๊ณผ ๋์์๋ฆฌ๋ฅผ ์๊ฐํด๋๋ฆฌ๊ณ ์ค์ ํจ๊ป ๊ตฌํ์ ํด๋ด์ผ๋ก์จ ํด๋น ๊ฐ๋
์ ๋ํ ์ดํด๋ฅผ ๋์ผ ๊ฒ์
๋๋ค.
- ํ์
ํํฐ๋ง์ ์๋ฆฌ
- ์ ์ฌ๋์งํ
- ๊ธฐ๋ณธ CF ์๊ณ ๋ฆฌ์ฆ
- ์ด์์ ๊ณ ๋ คํ CF
- ์ต์ ์ ์ด์ ํฌ๊ธฐ ๊ฒฐ์
- ์ฌ์ฉ์์ ํ๊ฐ๊ฒฝํฅ์ ๊ณ ๋ คํ CF
- ๊ทธ ์ธ์ CF ์ ํ๋ ๊ฐ์ ๋ฐฉ๋ฒ
- ์ฌ์ฉ์ ๊ธฐ๋ฐ CF์ ์์ดํ
๊ธฐ๋ฐ CF
- ์ถ์ฒ ์์คํ
์ ์ฑ๊ณผ์ธก์ ์งํ
Matrix Factorization(MF) ๊ธฐ๋ฐ ์ถ์ฒ
ํ๋ ฌ ์ฐ์ฐ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฃจ์ด์ง Matrix Factorization(MF)์ ๋ํ ๊ฐ๋
๊ณผ ๋์์๋ฆฌ๋ฅผ ์๊ฐํด๋๋ฆฌ๊ณ ์ค์ ํจ๊ป ๊ตฌํ์ ํด๋ด์ผ๋ก์จ ํด๋น ๊ฐ๋
์ ๋ํ ์ดํด๋ฅผ ๋์
๋๋ค.
- Matrix Factorization(MF) ๋ฐฉ์์ ์๋ฆฌ
- SGD(Stochastic Gradient Decent)๋ฅผ ์ฌ์ฉํ MF ์๊ณ ๋ฆฌ์ฆ
- SGD๋ฅผ ์ฌ์ฉํ MF ๊ธฐ๋ณธ ์๊ณ ๋ฆฌ์ฆ
- train/test ๋ถ๋ฆฌ MF ์๊ณ ๋ฆฌ์ฆ
- MF์ ์ต์ ํ๋ผ๋ฏธํฐ ์ฐพ๊ธฐ
- MF์ SVD
Surprise ํจํค์ง ์ฌ์ฉ
๊ฐํธํ๊ฒ CF์ MF ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ
์ ๊ตฌํํ๊ณ ํ
์คํธํด๋ณผ ์ ์๋ ํจํค์ง์ ๊ฐ๋
๊ณผ ๋์ ์๋ฆฌ๋ฅผ ๋ฐฐ์๋ด
๋๋ค.
- Surprise ๊ธฐ๋ณธ ํ์ฉ ๋ฐฉ๋ฒ
- ์๊ณ ๋ฆฌ์ฆ ๋น๊ต
- ์๊ณ ๋ฆฌ์ฆ ์ต์
์ง์
- ๋ค์ํ ์กฐ๊ฑด์ ๋น๊ต
- ์ธ๋ถ ๋ฐ์ดํฐ ์ฌ์ฉ
๋ฅ๋ฌ๋์ ์ฌ์ฉํ ์ถ์ฒ ์์คํ
๋ค์์ ์๋์ธต(hidden layer)์ ๊ฐ์ง ์ธ๊ณต์ ๊ฒฝ๋ง์ ๊ฐ๋
์ ํ์ฉํ์ฌ ์ถ์ฒ์์คํ
์ ๋์์ํฌ ์ ์๋ ์๋ฆฌ ๋ฐ ์ค์ต์ ํด๋ด์ผ๋ก์จ ํด๋น ๊ฐ๋
์ ๋ํ ์ดํด๋ฅผ ๋์
๋๋ค.
- Matrix Factorization(MF)์ ์ ๊ฒฝ๋ง์ผ๋ก ๋ณํํ๊ธฐ
- Keras๋ก MF ๊ตฌํํ๊ธฐ
- ๋ฅ๋ฌ๋์ ์ ์ฉํ ์ถ์ฒ ์์คํ
- ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ณ์ ์ถ๊ฐํ๊ธฐ
ํ์ด๋ธ๋ฆฌ๋ ์ถ์ฒ ์์คํ
๋ค์์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฒฐํฉ์ ํตํ ์ํธ ์ฑ๋ฅ ๋ณด์ ๋ฐ ๊ฐ์ ์ ๋ํ ๋ฐฉ๋ฒ๋ก ์ ์ธ ๋ด์ฉ๊ณผ ์ค์ ์ค์ต์ ํตํด ์ดํด๋ฅผ ๋์ผ ๊ฒ์
๋๋ค.
- ํ์ด๋ธ๋ฆฌ๋ ์ถ์ฒ ์์คํ
์ ์ฅ์
- ํ์ด๋ธ๋ฆฌ๋ ์ถ์ฒ ์์คํ
์ ์๋ฆฌ
- ํ์ด๋ธ๋ฆฌ๋ ์ถ์ฒ ์์คํ
(CF์ MF์ ๊ฒฐํฉ)
๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ๋ฅผ ์ํ Sparse Matrix ์ฌ์ฉ
๊ฐ๋นํ ์ ์๋ ์ ๋์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ๊ณผ ์ค์ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉ๊น์ง์ ๊ณผ์ ์ ๋ฐฐ์๋ด์ผ๋ก์จ ์ค์ ์คํฌ์ ๋ํ ๊ฐ๊ฐ์ ์ตํ๋ณผ ๊ฒ์
๋๋ค.
- Sparse Matrix์ ๊ฐ๋
๊ณผ Python์์์ ์ฌ์ฉ
- Sparse Matrix๋ฅผ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ๊ธฐ
์ถ์ฒ ์์คํ
๊ตฌ์ถ์์์ ์ด์
์ค์ ์ถ์ฒ์์คํ
์ ๊ตฌ์ถํ ๋ ์์ฃผ ๋ฐ์ํ๋ ๋ฌธ์ ๋ ์ด์๋ค์ ์ด ์ ๋ฆฌ๋ฅผ ํตํด ์ค์ ์ถ์ฒ ์์คํ
์ ์ ๊ณผ์ ์ ์ํ์ฐฉ์ค๋ฅผ ์กฐ๊ธ์ด๋๋ง ์ค์ฌ๊ฐ ์ ์๋ ์ฌ๋ฌ ๊ฐ์ง ๋
ธํ์ฐ๋ฅผ ์ง์ ์ตํ๋ด
๋๋ค.
- ์ ๊ท ์ฌ์ฉ์์ ์์ดํ
(Cold Start Problem)
- ํ์ฅ์ฑ(Scalability)
- ์ถ์ฒ์ ํ์ฉ(Presentation)
- ์ด์ง์ ๋ฐ์ดํฐ(Binary Data)์ ์ฌ์ฉ
- ์ฌ์ฉ์์ ๊ฐ์ ํ๊ฐ ๋ฐ์ดํฐ(Indirect Evaluation Data) ํ๋ณด
์ง์๊ณต์ ์์
Q&A๋ฅผ ํ์ธํด๋ณด์ธ์! ๐ฌ
Q. ์ ์ ์ง์(Python, Numpy, Pandas ,Keras)์ ๋ฐ๋์ ์์์ผ ํ๋์?
Python์ ๋ฐ๋์ ์์์ผ ํ์ง๋ง, ๋ค๋ฅธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ๋ฏธ๋ฆฌ ๋๋ฌด ๊น๊ฒ ํ์ตํ์ค ํ์๋ ์๊ณ ๊ฐ์๋ฅผ ๋ค์ผ์๋ฉด์ ๋์ค๋ ๋ด์ฉ ์ค์ ๋ชจ๋ฅด๋ ๋ด์ฉ๋ค๋ง ๋ฐ๋ก ์ฐพ์์ ๊ณต๋ถํ์๋ ๊ฒ๋ ์ถ์ฒ๋๋ฆฝ๋๋ค. ๊ฐ์์์ ์ฌ์ฉํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ฉ๋ค์ ์์ฃผ ์ ์ฉํ๊ณ ํํ ์ฌ์ฉ๋๋ ๊ฒ๋ค์ด๋ ์ฒ์ ๊ณต๋ถํ์๋ ๋ถ๋ค๊ป๋ ์ด๋ค ๊ฒ๋ถํฐ ๋จผ์ ๊ณต๋ถํด์ผ ํ ์ง ๊ฐ์ด๋๋ผ์ธ์ด ๋ ์๋ ์์ ๊ฒ ๊ฐ๋ค์. ๐
Q. ๋ฐ์ดํฐ๋ ๋ฏธ๋ฆฌ ์ ๊ณต์ด ๋๋์?
๋ฌผ๋ก ์
๋๋ค. ๋ชจ๋ ๊ฐ์์์ ํ์ฉ๋๋ ๋ฐ์ดํฐ๋ ๋ฏธ๋ค์ํ ๋ํ์ ๊ทธ๋ฃน๋ ์ฆ(GroupLens) ํ๋ก์ ํธ์ ์ํด ๊ฐ๋ฐ๋์ด ๊ฒ์ฆ๋ MovieLens ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๊ฒ์ด๊ณ , ์์
์์ ์ ์ ๊ณต๋๋ ๋ฐ์ดํฐ URL์ ํตํด์ ๋ค์ด ๋ฐ์ผ์๋ฉด ๋ฉ๋๋ค.
Q. ๊ฐ์๋ฅผ ๋ค์ผ๋ฉด ์ค์ ์ถ์ฒ ์์ง์ ๊ฐ๋ฐํ ์ ์๋์?
๋ชจ๋ ๊ฐ์ ์ฑํฐ์์๋ ๋ค์ํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋
๋ฟ๋ง ์๋๋ผ ์ค์ ์ค์ต์ ํจ๊ป ๋ณํํ๊ณ ์์ต๋๋ค. ๊ทธ๋์ ํจ๊ป ์ค์ตํ ์ฝ๋์์ ๊ฐ์ ๋๋ฉ์ธ์ ๋ง๊ฒ ์ฝ๊ฐ์ ๋ณํ๋ง ํ๋ค๋ฉด ์ฌ๋ฌ๋ถ๋ง์ ์ถ์ฒ์์ง์ ๊ฐ๋ฐํ์ค ์ ์์ต๋๋ค.
Q. ํ์ด์ฌ์ ๋ฐ๋ก ์ค์นํด์ผ ํ๊ฑฐ๋, ๊ฐ๋ฐ ํ๊ฒฝ์ ๋ฐ๋ก ๊ตฌ์ฑํด์ผ ํ๋์?
์ ํ ๊ทธ๋ฌ์ค ํ์๊ฐ ์์ต๋๋ค. ์ค์น ๋ฐ ๊ฐ๋ฐํ๊ฒฝ ๊ตฌ์ถ์ ๋ฒ๊ฑฐ๋ก์์ ๊ฑท์ด๋ด๊ธฐ ์ํด์ google ์์ ์ ๊ณตํ๋ ์น ํ๊ฒฝ ์๋ํฐ Colab์ ์ฌ์ฉํ ๊ฒ์
๋๋ค.
์์ธํ Colab ์ฌ์ฉ๋ฒ์ ์ ๋ธ๋ก๊ทธ๋ฅผ ํตํด์ ํ์ธ ํ์๊ฑฐ๋, ๊ตฌ๊ธ ๊ฒ์์ colab ์ฌ์ฉ๋ฒ์ด๋ผ๊ณ ๊ฒ์ํ์๋ฉด ๋ ์์ธํ๊ฒ ํ์ธํ์ค ์ ์์ต๋๋ค.
๊ฑฐ์น์ฝ๋ฉ์ ๋ค๋ฅธ ๊ฐ์๊ฐ ๊ถ๊ธํ๋ค๋ฉด? ๐