
๊ฐํํ์ต ์ ๋ฌธ์์ Deep Q-learning/Policy Gradient๊น์ง
YoungJea Oh
์ต๊ทผ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์ ๋๋ผ์ด ์ฑ๊ณผ๋ ๋ชจ๋ ๊ฐํ ํ์ต ๋ถ์ผ์์ ๋ฐํ๋๊ณ ์์ต๋๋ค. ๋ก๋ด, ์์จ ์ฃผํ ๊ธฐ์ , ์ธ๊ฐ์ ๋ฎ์ ๊ธฐ๊ณ ๋ฑ ์ง์ ํ ์ธ๊ณต ์ง๋ฅ ๊ธฐ์ ์ ํ์ ์ ์ด๋ฃจ์ด ๋ด๊ณ ์๋ ๊ฐํ ํ์ต ๊ธฐ์ ์ ์ด๋ณด์์ ์์ ์ผ๋ก ์๊ธฐ ์ฝ๊ฒ ๊ธฐ์ด์์ ๊ณ ๊ธ ์์ค๊น์ง ๋ค๋ฃจ์์ต๋๋ค.
์ค๊ธ์ด์
Python, ๋ฅ๋ฌ๋, ๊ฐํํ์ต



















![[Pytorch] ํ์ดํ ์น๋ฅผ ํ์ฉํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๊ตฌ์ถ๊ฐ์ ์ธ๋ค์ผ](https://cdn.inflearn.com/public/courses/329226/cover/056ed444-5b26-40fc-b4d6-8e03b2f23890/DL_pytorch.jpg?w=420)







![[AI ์นํธํค] ์ค๋๋ถํฐ ๋น์ ๋ ํผ์ง์ปฌ AI ์ข ์๋ ์ฌ๋๊ฐ์ ์ธ๋ค์ผ](https://cdn.inflearn.com/public/files/courses/340712/cover/ai/2/67356416-3a86-427e-b742-5a33663c4ad0.png?w=420)