Tag: backbone
All the articles with the tag "backbone".
- 7.4
VLM 真的需要 Vision Transformer 吗?SSM 视觉编码器表现更优
系统性评测发现,在匹配的 ImageNet 初始化条件下,SSM 视觉编码器在 VQA 和定位任务上全面优于 ViT
All the articles with the tag "backbone".
系统性评测发现,在匹配的 ImageNet 初始化条件下,SSM 视觉编码器在 VQA 和定位任务上全面优于 ViT