Unity Machine Learning Agentใฎๅฎๅ จๅพๆ๏ผใขใใชใฑใผใทใงใณ๏ผ
ใใฎ่ฌ็พฉใงใฏใใใซใใจใผใธใงใณใใใซใชใญใฅใฉใ ๅญฆ็ฟใๅๆฃๅญฆ็ฟใชใฉใๆฉๆขฐๅญฆ็ฟใจใผใธใงใณใใฎใใพใใพใชๆฉ่ฝใซใคใใฆๅญฆใณใๅฎ้ใซไฝฟ็จใใใใจใใงใใพใใใพใใๅฅฝๅฅๅฟใซๅบใฅใๆข็ดขใใๅฏๅค็ใชๅ ฅๅใซใๅฏพๅฟๅฏ่ฝใชๅผทๅๅญฆ็ฟใขใซใดใชใบใ ใซใคใใฆใๅญฆ็ฟใงใใพใใ
ๅ่ฌ็ 126ๅ
้ฃๆๅบฆ ไธญ็ดไปฅไธ
ๅ่ฌๆ้ ็กๅถ้

- ่งฃๆฑบ
๋ท์ง ckpt ๋ชจ๋ธ ํ์ผ์ onnx๋ณํ ํ unity์์ ์ถ๋ก
์๋ ํ์ธ์. ๋ท์ง ckpt ๋ชจ๋ธ ํ์ผ์ onnx๋ก ๋ณํ ํ unity์์ ์ถ๋ก ํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์๋ ค์ฃผ์ค ์ ์์๊น์?
unity๊ฐํํ์ตunity-ml-agents1234567891011121314
ใป
7ใถๆๅ
0
124
2
- ่งฃๆฑบ
(PPO ์ค์ต 2) total_loss ๊ตฌํ๋ ์ฝ๋์์ action entropy ๋ ์ด๋ป๊ฒ ๊ณ์ฐ๋ ๊ฒ์ธ์ง ๊ถ๊ธํฉ๋๋ค.
์ฐ์ ์ข์ ์์ ๊ฐ์ฌ๋๋ฆฝ๋๋ค. PPO ์๊ณ ๋ฆฌ์ฆ ์์ ์์ PPO Actor-Critic Network ์ ์ ์ฒด ์์ค ๊ฐ์ clipped surrogate objective - c1 * value loss (critic loss)
unity๊ฐํํ์ตunity-ml-agentsy2gon28999
ใป
0
305
1
- ๆช่งฃๆฑบ
์์ ํ์ผ ์คํ ์ค๋ฅ
<img src="https://cdn.inflearn.com/public/fil
unity๊ฐํํ์ตunity-ml-agentsssb2022815
ใป
0
277
1
- ่งฃๆฑบ
PPO ์๊ณ ๋ฆฌ์ฆ์ ml-agents learn ๋ช ๋ น์ด๋ก ํ์ต ๋ฐ ์ถ๋ก ํ ๋ ๋ฉ์๋ ํธ์ถ ์์ ์ง๋ฌธ
์๋ ํ์ธ์!๋จผ์ ๊ธฐ์ดํธ์ ์ด์ด์ ์์ฉํธ ๊ฐ์๋ฅผ ๊ณต๊ฐํด์ฃผ์ ์ ์ ๋ง ๊ฐ์ฌํฉ๋๋ค!! ํด๋น ๊ฐ์๋ฅผ ๋ค์ผ๋ฉด์ PPO ์๊ณ ๋ฆฌ์ฆ์ ml-agents learn ๋ช ๋ น์ด๋ก ํ์ต ํ ๋์ ์ถ๋ก ํ ๋ ๋ฉ์๋ ํธ์ถ ์์์ ๋ํด์ ๊ถ๊ธํฉ๋๋ค
unity๊ฐํํ์ตunity-ml-agentsyji112
ใป
0
351
1

