Học Transformer thông qua việc triển khai

Từ Multi Head Attention đến mô hình Original Transformer, BERT, mô hình dịch thuật MarianMT dựa trên Encoder-Decoder, cho đến Vision Transformer, bạn sẽ học hiểu sâu sắc về Transformer thông qua việc tự tay triển khai code.