-
Stagehand – AI网页浏览框架,提供简单和可扩展的网页自动化解决方案
Stagehand项目简介 Stagehand是简单和可扩展的AI网页浏览框架,是Playwright的继承者,提供act、extract和observe三个简单的API,支持自然语言驱动的网页操作。Stagehand提供一个轻量级、可配置、模块化的框架,无需复杂抽象,支持不同模型和提供商。Stagehand基于原子指令执行自动化任务,提高可靠性,步骤规划由更高层次的代理处理。 Stagehand…- 1
-
ACI.dev – 为AI智能体设计的开源MCP基础设施平台
ACI.dev项目简介 ACI.dev 是开源的基础设施平台,专为 AI 智能体设计,提供强大的工具调用支持。集成了 600 多种预构建工具,涵盖 Gmail、Slack、Notion 等常见应用,支持通过函数调用或 MCP 服务器灵活访问。多租户认证和动态工具发现功能,让 AI 智能体可以根据需求动态调用工具,通过自然语言定义权限边界,确保安全运行。ACI.dev 采用框架无关的设计,兼容任何 …- 2
-
Shandu – AI研究工具,自动进行多层次信息挖掘和分析
Shandu项目简介 Shandu 是开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。Shandu 的核心功能包括递归探索、多引擎搜索、智能网页爬取以及报告生成。用户可以通过简单的命令行操作,输入研究主题,设置深度和广度参数,可快速生成包含引用的 Markdown 格式研究报告。支持 Google、D…- 1
-
Midjourney角色一致性命令 "cref "测评如何保持多个角色一致性
预告了好久的MJ角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。 官方文档说明看下图: 在提示后输入 --cref URL 并输入字符图像的 URL网址,再使用--c…- 1
-
Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
Parakeet TDT 0.6B项目简介 Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持续时间加速推理,减少计算开销。模型在1秒内可转录60分钟音频,实时因子(RTFx)达3386,平均单词错误率(WER)仅为6.05%,在LibriSpeech-clean数据集上WER低至1.69…- 1
-
Evolving Agents – 开源的AI Agent管理与进化框架
Evolving Agents项目简介 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于过往经验进化,有效解决复杂任务。框架具备智能代理进化、代理间通信等核心功能。Evolving Agents 适用于文档处理、医疗保健、金融分析、客户服务等多领域场景,旨在通过智能代理的协同工作提升任…- 0
-
DressCode – 上海科技大学推出的3D服装生成框架
DressCode项目简介 DressCode是上海科技大学、宾夕法尼亚大学和Deemos科技联合推出的3D服装生成框架。支持用户通过文本描述来自动生成各种风格和材质的3D服装模型。基于SewingGPT核心模块,DressCode能理解文本提示并转化为精细的裁剪图案,再结合物理基础的渲染技术,创造出逼真的服装效果。 DressCode优势介绍 文本驱动的服装生成:用户输入文本描述,系统自动生成相…- 0
-
SaRA – 上海交大联合腾讯推出的预训练扩散模型微调方法
SaRA项目简介 SaRA是一种新型的预训练扩散模型微调方法,由上海交通大学和腾讯优图实验室共同推出。基于重新激活预训练过程中看似无效的参数,让模型能适应新任务。SaRA基于核范数低秩稀疏训练方案避免过拟合,引入渐进式参数调整策略,优化模型性能。SaRA能提高模型的适应性和泛化能力,显著降低计算成本,只要修改一行代码即可实现,具有很高的实用价值。 SaRA优势介绍 参数重新利用:激活在预训练中未被…- 1