全部标签

AI Agent

MLE-bench – OpenAI推出AI代理性能评估的基准测试工具

MLE-bench项目简介 MLE-bench 是 OpenAI 推出的一个基准测试工具，旨在衡量AI代理（AI Agent）在机器学习工程任务中的表现。测试包含75个来自 Kaggle 的竞赛任务，覆盖自然语言处理、计算机视觉和信号处理等多个领域。AI 代理在这个环境中完成理解比赛描述、处理数据集、训练模型、提交结果等一系列任务，最终根据排行榜得分评估能力。MLE-bench 的设计注重挑战性和…
工具测评
- 0
- 0
AI逻界7月29日
FinRobot – 开源 AI Agent 平台，解决金融领域应用的综合解决方案

FinRobot项目简介 FinRobot是开源的AI代理平台，专注于金融领域的应用。基于大型语言模型（LLMs）来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链（CoT）提示功能，将难题分解成逻辑步骤，增强分析能力。FinRobot通过开源项目，让更多人能访问和使用金融专业LLM工具，促进AI在金融决策中的广泛应用。架构包括金融AI代理层、金融LLM算法层、LLMOps和Data…
工具测评
- 1
- 0
AI逻界7月26日
Cradle – 通用计算机控制的多模态AI Agent框架

Cradle项目简介 Cradle是面向通用计算机控制（General Computer Control, GCC）的多模态AI Agent框架，由昆仑万维携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校机构推出的通用计算机控制框架，使AI Agent无需训练便能像人一样直接控制键盘鼠标，不依赖任何内部API，实现任意开闭源软件交互。 Cradle是迄今为止第一个既能玩多种商业游…
工具测评
- 2
- 0
AI逻界7月22日
node-DeepResearch – Deep Research开源复现版 AI Agent，支持多步推理和复杂查询

node-DeepResearch项目简介 node-DeepResearch 是开源的 AI 智能体项目，基于持续搜索和阅读网页，用 Gemini 语言模型和 Jina Reader 工具，逐步推理、回答复杂问题，直到找到答案或超出 token 预算。项目支持多步推理和复杂查询，能处理从简单问题到多步推理的复杂任务。node-DeepResearch提供 Web Server API，方便用户基…
工具测评
- 2
- 0
AI逻界7月19日
Agents – AIWaves公司推出的AI Agent开发工具

Agents项目简介 Agents是AIWaves公司推出的AI Agent开发工具，支持用户对AI模型进行详细调整和优化，构建更加智能和个性化的AI Agent。通过Agents平台，用户可以自定义AI模型的行为和响应，实现高级的自动化任务和交互体验。Agents平台适合需要高度定制化AI解决方案的企业用户，提供了强大的工具和灵活性，满足不同场景下的具体需求。 Agents优势介绍自定义AI行…
工具测评
- 1
- 0
AI逻界7月15日
Evolving Agents – 开源的AI Agent管理与进化框架

Evolving Agents项目简介 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作，根据语义理解需求、基于过往经验进化，有效解决复杂任务。框架具备智能代理进化、代理间通信等核心功能。Evolving Agents 适用于文档处理、医疗保健、金融分析、客户服务等多领域场景，旨在通过智能代理的协同工作提升任…
工具测评
- 2
- 0
AI逻界7月13日
微软发布全新Windows桌面 Agent 操作系统 UFO²

近日，微软正式发布全新桌面智能代理操作系统 UFO²（Desktop AgentOS），作为开源项目AgentUFO的重磅升级版。UFO²深度整合Windows平台，支持通过自然语言指令自动化管理多应用程序操作，大幅提升任务执行效率与智能化水平。 UFO²引入了多项创新功能，包括深度系统API调用、混合控制执行（GUI操作与API调用自适应）、智能推测执行机制以及知识增强检索系统。同时，UFO²即…
AI资讯
- 6
- 0
AI逻界7月13日
AutoAgents – AI Agent 生成框架，自然语言创建和部署LLM智能体

AutoAgents项目简介 AutoAgents 是基于大型语言模型（LLM）的自动智能体生成框架，能根据用户设定的目标自动生成多个专家角色的智能体，通过协作完成复杂任务。项目通过智能自动化技术，帮助开发者、数据科学家和企业用户更高效地完成复杂任务。 AutoAgents优势介绍动态生成智能体：根据任务需求动态生成多个专家角色的智能体，每个智能体具有特定的技能和知识。任务规划与执行任务规划…
工具测评
- 2
- 0
AI逻界7月9日
Agent TARS – 字节跳动开源的多模态 AI Agent 项目

Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容，与浏览器、命令行和文件系统无缝集成，实现复杂任务的规划与执行。Agent TARS 提供桌面客户端，展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力，成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段，仅支持 mac…
工具测评
- 5
- 0
AI逻界6月26日
VoltAgent – 开源的AI Agent构建和编排框架

VoltAgent项目简介 VoltAgent 是开源的 TypeScript 框架，用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具，简化与大语言模型（LLM）的交互、状态管理、外部工具连接和工作流编排的复杂性。开发者jiyu 模块化组件快速构建从简单聊天机器人到复杂多Agent系统的各种应用，支持多种 LLM 提供商（如 OpenAI、Google 等…
工具测评
- 2
- 0
AI逻界6月24日
AutoGLM沉思 – 首个免费、具备深度研究和操作能力的AI Agent

AutoGLM沉思项目简介 AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent，能模拟人类思维过程，处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和自主操作能力，支持进行多步骤的深度思考，像人类一样自主浏览和操作网页，完成从数据检索、分析到生成报告。AutoGLM沉思基于智谱自研的推理模型GLM-Z1-Air训练而成，完全免费且不限量使用，是智谱在AI A…
工具测评
- 3
- 0
AI逻界6月24日
Magnitude – 开源 AI Agent 驱动的端到端测试框架

Magnitude项目简介 Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例，用强大的推理代理规划和调整测试流程，基于快速的视觉代理执行测试。Magnitude 支持本地运行和 CI/CD 流水线集成，提供托管服务，包括托管的浏览器基础设施和 LLM 基础设施，简化测试管理。Magnitude帮助开发者高效地测试 Web 应用，确…
工具测评
- 4
- 0
AI逻界6月23日
LangGraph WhatsApp Agent – 用于构建与 WhatsApp 用户互动的 AI Agent

LangGraph WhatsApp Agent项目简介 LangGraph WhatsApp Agent 是基于 LangGraph 和 Twilio 构建的开源项目，用在开发与 WhatsApp 用户互动的 AI Agent。项目支持多代理架构和图谱处理，能处理文本和图像消息，保持持久化对话状态。项目集成 Model Context Protocol (MCP) 服务器，支持多种语言模型。安全…
工具测评
- 4
- 0
AI逻界6月11日
AutoGLM – 智谱AI推出的模拟人类操作手机的AI智能体

AutoGLM项目简介 AutoGLM是智谱AI团队最新推出的 “Phone Use” AI智能体，基于图形用户界面（GUI）实现自主任务完成。AutoGLM能模拟人类在手机操作，执行如社交媒体互动、在线购物、酒店预订等任务。AutoGLM能接收简单的文字或语音指令，自动完成复杂的操作流程，无需用户手动干预。 AutoGLM的技术核心包括基础智能体解耦合中间界面和自进化在线课程强化学习框架，让Au…
工具测评
- 3
- 0
AI逻界6月9日
Composio – AI智能体开发辅助工具，提供100+集成工具简化开发流程

Composio项目简介 Composio 是一个AI智能体开发辅助工具，提供100+集成工具，简化了 AI Agent的开发和部署，支持开发者通过一行代码调用多种工具和框架，如 OpenAI 和 Claude、LlamaIndex 等。Composio 支持多种编程语言，提供丰富的 API 和插件系统，多种身份验证协议。旨在提高 AI 助手的实用性和交互性，适用于自动化软件开发、内容管理、数据管…
工具测评
- 2
- 0
AI逻界6月7日
II-Agent – Intelligent Internet开源的通用AI Agent框架

II-Agent项目简介 II-Agent 是开源的Agent框架，通过与大型语言模型（LLM）的交互，简化和提升跨多个领域的工作流程。具备多种核心功能，包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化以及问题解决等。II-Agent 采用核心智能体架构与 LLM 交互，能动态调整上下文提示，全面管理交互历史，智能处理 token 限制。具备规划与反思能力，能进行问题分解、顺…
工具测评
- 4
- 0
AI逻界6月4日
LiveKit Agents – 创建实时与用户互动的多模态AI代理框架

LiveKit Agents项目简介 LiveKit Agents 是一个强大的框架，用于创建能实时通过语音、视频和数据与用户互动的多模态AI代理。框架支持 Python 编程，简化开发过程，支持开发者轻松集成语音识别、语音合成和先进的语言模型。LiveKit Agents 与 OpenAI 的实时 API 深度集成，提供超低延迟的 WebRTC 传输，确保流畅的用户体验。LiveKit Agen…
工具测评
- 5
- 0
AI逻界6月3日