• SigLIP 2 – 谷歌 DeepMind 推出的多语言视觉语言编码器模型
  • HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架
  • Janus-Pro – DeepSeek 开源的统一多模态模型
  • ItiNera – 港大与MIT联合推出的AI城市行程规划(OUIP)系统
  • Mini-InternVL – 上海AI Lab联合清华等机构推出的轻量级多模态大模型
  • AndroidGen – 智谱推出增强大语言模型 Agent 能力的框架
  • Maestro – 开源的端到端自动化测试框架
  • APB – 清华联合腾讯等机构推出的分布式长上下文推理框架
12345...88