• GOT-OCR2.0 – 开源的端到端OCR模型,多语言多模态识别,多样化输入输出
  • MakeAnything – 新加坡国立大学开源的一致性图片序列生成框架
  • Mistral Medium 3 – Mistral AI推出的多模态语言模型
  • FastVLM – 苹果推出的高效视觉语言模型
  • Pixel Reasoner – 滑铁卢联合港科大等高校推出的视觉语言模型
  • Promptim – AI提示优化库,自动迭代优化、生成最佳配置
  • Baichuan4-Finance – 百川智能推出的全链路金融领域增强大模型
  • AutoGLM – 智谱AI推出的模拟人类操作手机的AI智能体
1...45678...18