• QVQ – 阿里通义开源的视觉推理模型
  • OSUM – 西北工业大学开源的语音理解模型
  • CogSound – 智谱AI最新推出的音效模型
  • 交交 – 上海交大推出的口语对话情感大模型
  • DeepSeek-V2.5 – DeepSeek开源的融合通用和代码能力的AI模型
  • FLUX1.1 – Black Forest Labs团队推出的超写实AI图像生成模型,代号“蓝莓”
  • ID-Animator – 腾讯等推出的个性化人物视频生成框架
  • Ichigo – 开源的多模态AI语音助手,实时处理语音和文本的交织序列