-
Linly-Dubbing – 开源AI视频工具,支持配音、翻译、对口型
Linly-Dubbing项目简介 Linly-Dubbing是一个开源AI视频翻译和配音工具,支持配音、翻译、对口型,能自动将视频内容翻译成多种语言,并生成字幕。通过WhisperX和FunASR进行精准语音识别,基于Edge TTS、XTTS 和 CosyVoice 等技术进行高质量语音合成。Linly-Dubbing通过OpenAI API和Qwen模型等进行字幕翻译,并且通过声音分离技术和…- 0
-
PromptFix – 微软开源的AI修图工具,通过提示词实现多种图像处理
PromptFix项目简介 PromptFix是微软推出的开源AI图像修复工具,基于扩散模型技术,能根据用户指令处理损坏的图片,移除不需要的元素。PromptFix支持多种图像处理任务,包括上色、物体移除、去雾、去模糊、去除水印、清除雪迹和增强低光照图像。PromptFix基于20步的去噪过程,有效纠正图像缺陷,且保持图像原有结构。PromptFix能适应不同长宽比的图像,具有很好的泛化能力。 P…- 2
-
Stagehand – AI网页浏览框架,提供简单和可扩展的网页自动化解决方案
Stagehand项目简介 Stagehand是简单和可扩展的AI网页浏览框架,是Playwright的继承者,提供act、extract和observe三个简单的API,支持自然语言驱动的网页操作。Stagehand提供一个轻量级、可配置、模块化的框架,无需复杂抽象,支持不同模型和提供商。Stagehand基于原子指令执行自动化任务,提高可靠性,步骤规划由更高层次的代理处理。 Stagehand…- 1
-
ACI.dev – 为AI智能体设计的开源MCP基础设施平台
ACI.dev项目简介 ACI.dev 是开源的基础设施平台,专为 AI 智能体设计,提供强大的工具调用支持。集成了 600 多种预构建工具,涵盖 Gmail、Slack、Notion 等常见应用,支持通过函数调用或 MCP 服务器灵活访问。多租户认证和动态工具发现功能,让 AI 智能体可以根据需求动态调用工具,通过自然语言定义权限边界,确保安全运行。ACI.dev 采用框架无关的设计,兼容任何 …- 2
-
Shandu – AI研究工具,自动进行多层次信息挖掘和分析
Shandu项目简介 Shandu 是开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。Shandu 的核心功能包括递归探索、多引擎搜索、智能网页爬取以及报告生成。用户可以通过简单的命令行操作,输入研究主题,设置深度和广度参数,可快速生成包含引用的 Markdown 格式研究报告。支持 Google、D…- 1
-
Midjourney角色一致性命令 "cref "测评如何保持多个角色一致性
预告了好久的MJ角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。 官方文档说明看下图: 在提示后输入 --cref URL 并输入字符图像的 URL网址,再使用--c…- 1
-
Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型
Parakeet TDT 0.6B项目简介 Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持续时间加速推理,减少计算开销。模型在1秒内可转录60分钟音频,实时因子(RTFx)达3386,平均单词错误率(WER)仅为6.05%,在LibriSpeech-clean数据集上WER低至1.69…- 1
-
Evolving Agents – 开源的AI Agent管理与进化框架
Evolving Agents项目简介 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于过往经验进化,有效解决复杂任务。框架具备智能代理进化、代理间通信等核心功能。Evolving Agents 适用于文档处理、医疗保健、金融分析、客户服务等多领域场景,旨在通过智能代理的协同工作提升任…- 0