Tag: 视觉分词器
All the articles with the tag "视觉分词器".
- 6.8
美团开源LongCat-Next:原生多模态架构统一图像、语音与文本Token
美团发布原生多模态大模型LongCat-Next及离散原生分辨率视觉分词器dNaViT,打破以语言为中心的拼凑式架构,通过纯NTP范式实现真正的多模态统一。
All the articles with the tag "视觉分词器".
美团发布原生多模态大模型LongCat-Next及离散原生分辨率视觉分词器dNaViT,打破以语言为中心的拼凑式架构,通过纯NTP范式实现真正的多模态统一。