
๊ฐํํ์ต ์ ๋ฌธ์์ Deep Q-learning/Policy Gradient๊น์ง
YoungJea Oh
์ต๊ทผ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์ ๋๋ผ์ด ์ฑ๊ณผ๋ ๋ชจ๋ ๊ฐํ ํ์ต ๋ถ์ผ์์ ๋ฐํ๋๊ณ ์์ต๋๋ค. ๋ก๋ด, ์์จ ์ฃผํ ๊ธฐ์ , ์ธ๊ฐ์ ๋ฎ์ ๊ธฐ๊ณ ๋ฑ ์ง์ ํ ์ธ๊ณต ์ง๋ฅ ๊ธฐ์ ์ ํ์ ์ ์ด๋ฃจ์ด ๋ด๊ณ ์๋ ๊ฐํ ํ์ต ๊ธฐ์ ์ ์ด๋ณด์์ ์์ ์ผ๋ก ์๊ธฐ ์ฝ๊ฒ ๊ธฐ์ด์์ ๊ณ ๊ธ ์์ค๊น์ง ๋ค๋ฃจ์์ต๋๋ค.
์ค๊ธ์ด์
Python, ๋ฅ๋ฌ๋, ๊ฐํํ์ต











.png?w=960)










![[Pytorch] ํ์ดํ ์น๋ฅผ ํ์ฉํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๊ตฌ์ถ๊ฐ์ ์ธ๋ค์ผ](https://cdn.inflearn.com/public/courses/329226/cover/056ed444-5b26-40fc-b4d6-8e03b2f23890/DL_pytorch.jpg?w=420)




![[์ ์กฐ DX ๋ํ์] 7๋ ์ฐ์
๋ณ AI ์ค๋ฌด ์ ์ฉ ์ ๋ต ๋ง์คํฐ ํด๋์ค๊ฐ์ ์ธ๋ค์ผ](https://cdn.inflearn.com/public/files/courses/342169/cover/ai/2/e0850074-3049-4f98-b6db-611d07ea5083.png?w=420)
