• SOLAMI – 南洋理工推出的VR端3D角色扮演AI系统
  • Scribe – ElevenLabs 推出的高精度语音转文本模型
  • LongVU – Meta AI开源的长视频理解模型
  • NVLM – 英伟达推出的多模态大型语言模型
  • 混元图生视频 – 腾讯混元开源的图生视频模型
  • 推荐最近3个开源AI项目:3D识别大语言模型,AI文本生成3D全景图,AI读懂视频唇语
  • 谷歌Gemini刚发布就引发争议:被质疑官方宣传片疑似剪辑效果,夸大AI能力宣传实测对标GPT-4测评基准有失偏颇
  • cobalt – 开源的流媒体下载工具,支持全平台视频、音频和图片下载