-
VFusion3D – Meta联合牛津大学推出的AI生成3D模型项目
VFusion3D项目简介 VFusion3D 是由 Meta 和牛津大学的研究人员共同推出的AI生成3D模型项目,能从单张图片或文本描述中生成高质量的3D对象。VFusion3D 通过微调预训练的视频 AI 模型来生成合成的3D数据,解决了3D训练数据稀缺的问题。VFusion3D 能在几秒内从单张图片生成3D模型,用户在测试中对其生成结果的偏好度超过90%,未来会在虚拟现实、游戏开发和数字设计…- 2
-
DreamClear – 中科院联合字节推出的高性能图像修复技术
DreamClear项目简介 DreamClear是中国科学院自动化研究所和字节跳动团队联合推出的高性能图像修复技术,专注于隐私安全的数据集管理,能将低质量(LQ)图像恢复为高质量(HQ)图像。提升了图像的细节和质量,确保数据隐私,符合现代社会对隐私保护的需求。 DreamClear优势介绍 图像恢复:DreamClear能将低质量图像恢复为高质量图像,提升图像的细节和质量。 隐私保护:在进行图像…- 2
-
GLM-4-Voice – 智谱AI推出的端到端情感语音模型
GLM-4-Voice项目简介 GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指令灵活调整语音的情感、语调、语速和方言等特征。模型由三个部分组成:GLM-4-Voice-Tokenizer负责将连续语音转换为离散token,GLM-4-Voice-Decoder将token转换回连续语音输出,GLM-4-Voice-9B基于GLM…- 3
-
Thinking Claude – 17岁高中生推出的神级Prompt工具,AI 思维更接近人类
Thinking Claude项目简介 Thinking Claude是基于深度思考协议和浏览器扩展工具,增强AI模型Claude-3.5的“深度思维”能力的项目,让其思考逻辑更接近人类。支持AI以自然、未经过滤的方式深入思考后再回应,支持思考过程的展开和折叠。Thinking Claude提供更易于阅读和管理的界面,让日常任务中的AI对话更加有趣和富有洞察力。 Thinking Claude优势…- 2
-
Stable Virtual Camera – Stability AI 等机构推出的 AI 模型,2D图像转3D视频
Stable Virtual Camera项目简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从 1 到 32 张输入图像生成不同宽高比(如 1:1、9:16、16:9)的视频,最长可达 1000 帧。 …- 3
-
SWE-Kit – 构建自定义软件工程AI代理的开源框架
SWE-Kit项目简介 SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模型集成,降低构建复杂 AI 代理的门槛。SWE-Kit 集成文件操作、代码分析、shell 命令执行等功能,提高开发效率、提供高度的可定制性,是现代 AI 辅助软件开发的领先工…- 2
-
CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型
CogAgent-9B项目简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理,具备双语(中英文)交互能力,能预测并执行GUI操作,实现自动化任务。在多个GUI操作数据集上取得了领先成绩,模型已开源,推动大模型Agent生态的发展。CogAgent-9B可广泛应用于个人电脑、…- 1
-
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude
DeepSeek V3项目简介 DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞争对手。最新版DeepSeek-V3-0324 拥有6850亿参数,采用混合专家架构,融合多头潜在注意力和多标记预测技术,推理速度达每秒20个t…- 1