/
Từ Multi Head Attention đến mô hình Original Transformer, BERT, mô hình dịch MarianMT dựa trên Encoder-Decoder, bạn sẽ học hiểu sâu sắc về Transformer thông qua việc trực tiếp triển khai bằng code.
62 học viên đang tham gia khóa học này