首页
抖音
B站
老司机
热门
网络
投稿
首页
抖音
B站
老司机
热门
网络
互联网梗百科
MiMo-V2-Flash
MiMo-V2-Flash 是小米开源的高性能语言模型,具有3090亿总参数和150亿激活参数。专为智能体AI设计,采用混合注意力架构,结合滑动窗口注意力(SWA)和全局注意力(GA),窗口大小为12...
查看更多
Little Caprice
12-22
LongCat-Video-Avatar
LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动态。LongCat-Video-Avat...
查看更多
牛奶泡芙
12-22
VTP
VTP(Visual Tokenizer Pre-training)是MiniMax视频团队开源的视觉生成模型预训练框架。框架聚焦优化视觉tokenizer,通过融合对比学习、自监督学习和重建学习等方...
查看更多
DA38
12-22
TRELLIS.2
TRELLIS.2是微软开源的40亿参数3D生成模型,专为从单张图片高效生成高保真3D资产设计。核心创新在于采用O-Voxel稀疏体素架构,能处理复杂拓扑结构(如开放表面、非流形几何),支持完整PBR...
查看更多
糖心小唯
12-22
GPT-5.2-Codex
GPT-5.2-Codex 是 OpenAI 推出的智能体编程模型,专为复杂软件工程和防御性网络安全设计。模型是 GPT-5.2 的升级版,提升了指令遵循、长语境理解等能力,在代码重构、迁移等大型变更...
查看更多
ladyyuan
12-22
EcomBench
EcomBench 是通义实验室联合 SKYLENAGE 推出的针对电商场景的 AI 能力评测基准。EcomBench 基于真实世界数据构建,涵盖政策咨询、成本估算、选品决策等七大类电商任务,全面衡量...
查看更多
尤奈
12-22
Kairos 3.0
Kairos 3.0(开悟世界模型3.0)是大晓机器人推出的行业首创的ACE具身研发范式、首个开源且商业应用的世界模型。Kairos 3.0是开源的高效世界基础模型,专注于学习真实世界的动态、因果关系...
查看更多
糖心小唯
12-22
FunctionGemma
FunctionGemma 是谷歌开源的专注于函数调用优化的轻量化AI模型,参数量为 2.7 亿。模型基于 Gemma 3 架构,专为在手机、浏览器等端侧设备上运行而设计,能将自然语言转化为可执行的 ...
查看更多
ladymoon
12-22
T5Gemma 2
T5Gemma 2 是谷歌开源的新型端侧多模态长上下文编码器 – 解码器模型。模型回归优化了经典 Transformer 架构,引入绑定词嵌入和合并注意力机制等创新,参数规模有 270M – 270M...
查看更多
nikoatnight
12-22
Qwen-Image-Layered
Qwen-Image-Layered是阿里团队推出的AI图像编辑模型,能将普通图片自动拆分为独立的RGB透明图层,实现类似Photoshop的分层编辑功能。通过注意力机制和位置编码动态拆分图层,支持3...
查看更多
梵拉
12-22
NitroGen
NitroGen 是英伟达联合斯坦福大学、加州理工学院等机构开发的开源通用游戏 AI 模型。基于4万小时、涵盖1000多款游戏的视频数据进行训练,采用大规模行为克隆方法。模型通过输入游戏视频帧,输出手...
查看更多
牛奶泡芙
12-22
Crocs
crocs(卡骆驰)是一家总部位于美国科罗拉多州的鞋履设计、生产及零售商,以crocs品牌于市场上推出男装、女装及童装的舒适鞋款。创立于2002年,crocs鞋子比较初的产品市场定位是帆船运动和户外运...
查看更多
萝莉小奈
12-22
下一页