• Co-op Translator – 微软推出面向开发者的开源多语言翻译工具
  • Pipecat – 构建语音和多模态对话代理的开源框架
  • AI时代的生成式3D大模型全面评测Tripo、Meshy、sudo、CSM究竟哪款更好用?
  • Qihoo-T2X – 360 AI 研究院和中山大学开源的高效多模态生成模型
  • 实战!国外视频博主创作全球首部每帧画面都由AI生成的科幻预告片:7小时完成,成本100美金!
  • 一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度Lumiere AI使用体验分享
  • VISION XL – AI视频修复处理工具,修复缺失、支持四倍超分辨率
  • FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型