transformer_pipeline

Support

Performance comparisons on ImageNet1K

Attention is all you need

Vision Transformer

SwinTransformer

CSwinTransformer

DETR

iRPE: Rethinking Position Encoding

Deformable Attention Transformer

CvT: Introducing Convolutions to Vision Transformers

CrossViT SwinTrack Stark

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.DS_Store		.DS_Store
CvT.jpg		CvT.jpg
README.md		README.md
att_is_all_you_need.jpg		att_is_all_you_need.jpg
crossvit.jpg		crossvit.jpg
cswin.jpg		cswin.jpg
dat.jpg		dat.jpg
detr.jpg		detr.jpg
rethinking_position_encoding.jpg		rethinking_position_encoding.jpg
stark.jpg		stark.jpg
swin.jpg		swin.jpg
swinTrack.jpg		swinTrack.jpg
vit.jpg		vit.jpg