SAIL-VL2
互联网
2025-10-16 10:05:32
SAIL-VL2 是抖音团队和新加坡国立大学联合开发的开源视觉语言基础模型,专注于多模态理解和推理。由视觉编码器 SAIL-ViT、视觉-语言适配器和大语言模型组成,采用渐进式训练框架,从视觉预训练到多模态融合,最终通过 SFT-RL 混合范式提升性能。SAIL-VL2 在架构上引入了混合专家(MoE)架构,突破了传统密集型模型的限制,显著提升了效率和性能。

![刀小刀sama我在#2022川渝春节联欢晚会# 等你~不见不散哦[打call]](https://imgs.knowsafe.com:8087/img/aideep/2022/1/28/a3dbd3c1e16404b68fe830498f5a3ae1.jpg?w=250)
![甄一一 sadsad 白化了个妆[怒] ](https://imgs.knowsafe.com:8087/img/aideep/2022/6/16/98da346f693cd4b7261937736b77d597.jpg?w=250)




