実装しながら学ぶTransformer

Multi Head Attentionから始まり、Original Transformerモデル、BERT、Encoder-DecoderベースのMarianMT翻訳モデル、Vision Transformerまで、コードで直接実装しながらTransformerについて隅々まで学ぶことができます。