-
GPDiT – 清华北大联合阶跃星辰等推出的视频生成模型
GPDiT项目简介 GPDiT(Generative Pre-trained Autoregressive Diffusion Transformer)是北京大学、清华大学、StepFun公司及中国科学技术大学推出的新型视频生成模型,模型结合扩散模型和自回归模型的优势,基于自回归方式预测未来的潜在帧,自然地建模运动动态和语义一致性。GPDiT引入轻量级因果注意力机制,减少计算成本,推出一种无参数的…- 2
-
Aether – 上海 AI Lab 开源的生成式世界模型
Aether项目简介 Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和目标导向视觉规划三大核心能力。Aether 能感知环境、理解物体位置和运动关系,做出智能决策。Aether 在真实世界中展现出强大的零样本泛化能力,使用虚拟数据训练完成高效完成复杂任务,为具身智能系统提供强大…- 0
-
Goedel-Prover – 自动化数学问题的形式证明生成开源推理模型
Goedel-Prover项目简介 Goedel-Prover(哥德尔证明器)是普林斯顿大学、清华大学、清华大学等机构推出的开源大型语言模型(LLM),用在自动化数学问题的形式证明生成。基于将自然语言数学问题翻译成形式语言(如Lean 4)生成形式化证明,解决形式化数学陈述和证明稀缺的问题。Goedel-Prover用专家迭代方法训练,基于不断扩展形式证明数据集,逐步提升证明能力。在多个基准测试中…- 5
-
olly.bot – 个人AI助理,集成多种通用AI能力支持本地使用
olly.bot项目简介 Olly.bot是集成于iMessage和SMS的个人AI助手,基于OpenAI大模型,提供网络搜索、文档分析、图片生成等功能。Olly.bot无需下载、注册,不收集用户身份信息,保护隐私。支持iOS、macOS、Android和Windows平台。Olly.bot的设计理念是成为多合一的AI伴侣,包括管理任务、导航、寻求个性化建议,改变用户与技术互动的方式。 olly.…- 2
-
Grok-2 – xAI公司推出的新一代AI模型
Grok-2项目简介 Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、编程和推理能力。在学术基准测试中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等领域的表现超越了前代Grok-1.5,与行业前沿模型相媲美。Grok-2在视觉任务MathVista和DocVQA上展现出行业领先的水平,并与Black Forest Labs的FLUX.1模型合作,扩展了Grok-2的…- 2
-
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统
WorldCraft项目简介 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布局进行精细调整。WorldCraft由三个核心模块组成:ForgeIt用在单个物体的定制,基于程序化生成实现精确的几何和纹理控制;ArrangeIt负责场景布局的生成,基…- 1
-
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型
Embodied Reasoner项目简介 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索、推理和行动协同完成复杂任务。模型基于模仿学习、自我探索和自我修正的三阶段训练方法,生成多样化的思考过程(如情境分析、空间推理、自我反思等),基于交互历史和空间布局进行高效规划和推理。在AI2-THOR模拟器的多种任务中,Emb…- 2
-
FLUX-Controlnet-Inpainting – 阿里妈妈推出的开源AI图像修复工具
FLUX-Controlnet-Inpainting项目简介 FLUX-Controlnet-Inpainting 是阿里妈妈(Alibaba’s Alimama)推出的一款图像修复工具,融合 ControlNet 和 FLUX.1-dev 技术。工具根据用户指定的掩码区域进行精确的图像修复,确保修复部分与原图风格一致。FLUX-Controlnet-Inpainting基于 ControlNet…- 3