inflearn logo
inflearn logo

[NLPๅฎŒๅ…จๆ”ป็•ฅ I] Attentionใฎ่ช•็”Ÿ๏ผšRNNใƒปSeq2Seqใฎ้™็•Œใ‹ใ‚‰ใ‚ขใƒ†ใƒณใ‚ทใƒงใƒณใ‚’ๅฎŸ่ฃ…ใ—ใชใŒใ‚‰็†่งฃใ™ใ‚‹NLP

ใชใœAttentionใŒๅฟ…่ฆใ ใฃใŸใฎใ‹ใ€ใใ—ใฆใฉใฎใ‚ˆใ†ใซๅ‹•ไฝœใ™ใ‚‹ใฎใ‹ใ‚’ใ€Œใ‚ณใƒผใƒ‰ใง็›ดๆŽฅๅฎŸ่ฃ…ใ—ใชใŒใ‚‰ใ€็†่งฃใ—ใพใ™ใ€‚ ใ“ใฎ่ฌ›็พฉใฏRNNใจSeq2Seqใƒขใƒ‡ใƒซใฎๆง‹้€ ็š„้™็•Œใ‹ใ‚‰ๅ‡บ็™บใ—ใ€ ๅ›บๅฎšใ•ใ‚ŒใŸใ‚ณใƒณใƒ†ใ‚ญใ‚นใƒˆใƒ™ใ‚ฏใƒˆใƒซใŒไฝœใ‚Šๅ‡บใ™ๆƒ…ๅ ฑใƒœใƒˆใƒซใƒใƒƒใ‚ฏๅ•้กŒใ€้•ทๆœŸไพๅญ˜ๆ€งๅ•้กŒใ‚’ๅฎŸ้จ“ใงๆคœ่จผใ— ใใฎ้™็•Œใ‚’่งฃๆฑบใ™ใ‚‹ใŸใ‚ใซAttentionใŒใฉใฎใ‚ˆใ†ใซ็™ปๅ ดใ—ใŸใฎใ‹ใ‚’่‡ช็„ถใซ็น‹ใ’ใฆ่ชฌๆ˜Žใ—ใพใ™ใ€‚ ๅ˜็ด”ใซๆฆ‚ๅฟตใ‚’็ดนไป‹ใ™ใ‚‹ใฎใงใฏใชใใ€ RNNใฎๆง‹้€ ็š„้™็•ŒใจSeq2Seqใฎๆƒ…ๅ ฑใƒœใƒˆใƒซใƒใƒƒใ‚ฏๅ•้กŒใ‚’็›ดๆŽฅๅฎŸ้จ“ใง็ขบ่ชใ—ใ€ ใ“ใ‚Œใ‚’่งฃๆฑบใ™ใ‚‹ใŸใ‚ใซ็™ปๅ ดใ—ใŸ**Bahdanau Attention๏ผˆๅŠ ็ฎ—็š„ใ‚ขใƒ†ใƒณใ‚ทใƒงใƒณ๏ผ‰**ใจ **Luong Attention๏ผˆๅ†…็ฉใ‚ขใƒ†ใƒณใ‚ทใƒงใƒณ๏ผ‰**ใ‚’ไธ€ใคใšใคๅฎŸ่ฃ…ใ—ใชใŒใ‚‰ใใฎ้•ใ„ใ‚’ๆ˜Ž็ขบใซ็†่งฃใ—ใพใ™ใ€‚ ๅ„ใ‚ขใƒ†ใƒณใ‚ทใƒงใƒณใŒ ใฉใฎใ‚ˆใ†ใชๆ–นๅผใงQueryโ€“Keyโ€“Value้–ขไฟ‚ใ‚’ๅฝขๆˆใ—ใ€ ้‡ใฟใ‚’่จˆ็ฎ—ใ™ใ‚‹้Ž็จ‹ใงใฉใฎใ‚ˆใ†ใชๆ•ฐๅญฆ็š„ใƒป็›ดๆ„Ÿ็š„้•ใ„ใ‚’ๆŒใกใ€ ใชใœๅพŒไปฃใƒขใƒ‡ใƒซใซ็น‹ใŒใ‚‰ใ–ใ‚‹ใ‚’ๅพ—ใชใ‹ใฃใŸใฎใ‹ ใใฎ็‰นๆ€งใจ้€ฒๅŒ–ใฎๆตใ‚Œใพใง่‡ช็„ถใซ็น‹ใŒใ‚Šใพใ™ใ€‚ AttentionใŒๆ–‡็ซ ใจๅ˜่ชžใ‚’ใฉใฎใ‚ˆใ†ใซๆ‰ใˆใ€ ๅ„ๅ˜่ชžใŒใฉใฎใ‚ˆใ†ใชๆ–นๅผใง้‡่ฆๅบฆใ‚’ไป˜ไธŽใ•ใ‚Œใฆๆƒ…ๅ ฑใ‚’็ตฑๅˆใ™ใ‚‹ใฎใ‹ใ‚’ ๆ•ฐๅผ โ†’ ็›ดๆ„Ÿ โ†’ ใ‚ณใƒผใƒ‰ โ†’ ๅฎŸ้จ“ใŒไธ€ใคใซ็น‹ใŒใฃใŸๅฝขใงๅญฆ็ฟ’ใ—ใพใ™ใ€‚ ใ“ใฎ่ฌ›็พฉใฏTransformerใ‚’ๆญฃใ—ใ็†่งฃใ™ใ‚‹ใŸใ‚ใฎใ€ŒๅŸบ็คŽไฝ“ๅŠ›ใ€ใ‚’็ฏ‰ใ้Ž็จ‹ใจใ—ใฆใ€ Attentionใจใ„ใ†ๆฆ‚ๅฟตใŒใชใœ้ฉๅ‘ฝ็š„ใ ใฃใŸใฎใ‹ใ€ ใใ—ใฆใใฎๅพŒใฎใ™ในใฆใฎๆœ€ๆ–ฐNLPใƒขใƒ‡ใƒซ๏ผˆTransformerใ€BERTใ€GPTใชใฉ๏ผ‰ใŒ ใชใœAttentionใ‚’ๆ ธๅฟƒๆง‹ๆˆ่ฆ็ด ใจใ™ใ‚‹ใฎใ‹ใ‚’ๆทฑใ็†่งฃใ™ใ‚‹ใ‚ˆใ†ใซใชใ‚Šใพใ™ใ€‚ RNN โ†’ Seq2Seq โ†’ Attentionใซ็น‹ใŒใ‚‹ๆตใ‚Œใ‚’ ๆฆ‚ๅฟตใงใฏใชใใ‚ณใƒผใƒ‰ใจๅฎŸ้จ“ใงไฝ“ๅŒ–ใ—ใŸใ„ๅญฆ็ฟ’่€…ใซๆœ€้ฉๅŒ–ใ•ใ‚ŒใŸ่ฌ›็พฉใงใ™ใ€‚

8ๅ ใŒๅ—่ฌ›ไธญใงใ™ใ€‚

้›ฃๆ˜“ๅบฆ ๅ…ฅ้–€

ๅ—่ฌ›ๆœŸ้–“ ็„กๅˆถ้™

Python
Python
Deep Learning(DL)
Deep Learning(DL)
PyTorch
PyTorch
attention-model
attention-model
transformer
transformer
Python
Python
Deep Learning(DL)
Deep Learning(DL)
PyTorch
PyTorch
attention-model
attention-model
transformer
transformer

ใŠ็Ÿฅใ‚‰ใ›

ๆ–ฐใ—ใ„ใŠ็Ÿฅใ‚‰ใ›ใŒใ‚ใ‚Šใพใ›ใ‚“ใ€‚

๏ฟฅ6,188