-
UI-TARS – 字节跳动推出的开源原生 GUI 代理模型
UI-TARS项目简介 UI-TARS是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力,能实时理解动态界面,通过多模态输入(如文本、图像)执行复杂的任务。 UI-TARS 的核心优势在于跨平台的标准化行动定义,支持桌面、移动和网页等多种环境。结合了快速直观反应和复杂任务规划的能力,支持多步推理、反…- 1
-
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统
Hunyuan3D 2.0项目简介 Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模型,再合成高分辨率纹理贴图。包含两个核心组件:Hunyuan3D-DiT(几何生成模型)和 Hunyuan3D-Paint(纹理合成模型),分别用于生成精确的几何结构和生动逼真的纹理。 Hunyuan3D…- 1
-
Quanta Quest – 开源的AI个人数据库产品,多平台数据整合
Quanta Quest项目简介 Quanta Quest是一款面向个人用户的开源AI智能数据库产品,基于将个人数据如Gmail、Dropbox、Notion等整合到一个平台上,用RAG技术提供AI搜索功能,帮助用户高效管理和检索信息。Quanta Quest特别强调隐私保护和数据安全,确保用户数据的本地化处理,在保护个人隐私的同时,提供强大的数据检索能力。Quanta Quest支持多种个人数据…- 0
-
DistilQwen2 – 阿里推出基于Qwen2优化的轻量级语言模型
DistilQwen2项目简介 DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言模型,能提高运算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增强指令数据多样性和优化蒸馏算法,将复杂知识传递给小模型,提升指令遵循效果。DistilQwen2 的研究为开发更智能、更高效的自然语言处理应用提供技术支持,赋能更多开发者和企业基于技术创新实现商业价值。 Dis…- 0
-
别再依赖Photoshop了!Midjourney全新上线AI画质增强功能Upsacle,4K超清修复老照片
AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/404.html 画师家人们,Midjo…- 3
-
PaperBench – OpenAI 开源的 AI 智能体评测基准
PaperBench项目简介 PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验,全面展现从理论到实践的自动化能力。PaperBench包含8316个评分节点,基于层次化评分标准,用自动评分系统提高效率。评测结果显示,目前主流AI模型在复现任务中表现不如顶级机器学习专家,表明智能体在长期…- 0
-
Open Avatar Chat – 阿里开源的实时数字人对话系统
Open Avatar Chat项目简介 Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响应延迟约2.2秒),兼容多模态语言模型,包括文本、音频和视频等多种交互方式。系统基于模块化设计,用户根据需求灵活替换组件,实现不同的功能组合。Open Avatar Chat 为开发者和研究…- 0
-
FramePack – 斯坦福开源的AI视频生成模型
FramePack项目简介 FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的计算复杂度。FramePack 仅需 6GB 显存在普通笔记本电脑上运行,支持实时生成高清视频,基于抗漂移采样技术保证视频稳定性和连贯性。FramePack提供灵活的调度策略,适用于多种应用场景,降低 AI 视频生…- 0