全部标签

UI

AI绘画进阶入门ComfyUI系列教程第八章，只需一步极速出图，实时绘画！！

【视频简介】本视频是一期关于ComfyUI系列教程的内容，主要介绍了LCM和Turbo两种极速出图的方法以及实时绘画的技巧。视频中演示了如何在ComfyUI中使用LCM和Turbo进行实时绘画，并提到了使用XL模型进行二次精炼的方法。LCM和Turbo都是提高出图效率的有效方法，具体选择哪种方法取决于个人需求和实际情况。此外，视频还提到了实时修改图像的颜色、背景和服装的方法，以及使用绘画组件进行…
AI教程
- 3
- 0
AI逻界7月29日
UI-TARS – 字节跳动推出的开源原生 GUI 代理模型

UI-TARS项目简介 UI-TARS是字节跳动推出的新一代原生图形用户界面（GUI）代理模型，通过自然语言实现对桌面、移动设备和网页界面的自动化交互。具备强大的感知、推理、行动和记忆能力，能实时理解动态界面，通过多模态输入（如文本、图像）执行复杂的任务。 UI-TARS 的核心优势在于跨平台的标准化行动定义，支持桌面、移动和网页等多种环境。结合了快速直观反应和复杂任务规划的能力，支持多步推理、反…
工具测评
- 2
- 0
AI逻界7月24日
Trae 集成 Gemini 2.5 Pro Preview，Web 应用开发迎来新突破

根据最新消息，Trae 平台已完成更新，正式支持 Google 最新发布的 Gemini2.5Pro Preview（I/O 版）模型。这一升级使 Trae 在前端开发和用户界面(UI)设计领域迈出重要一步，为开发者提供更强大的工具支持。据悉，Gemini2.5Pro Preview 在 WebDev Arena 排行榜上荣登榜首，Elo 分数较前一版本提升35点，达到1443分，超越了 Cl…
AI资讯
- 3
- 0
AI逻界7月22日
ComfyUI-MochiEdit – 开源的AI视频编辑工具，支持视频转视频和局部编辑

ComfyUI-MochiEdit项目简介 ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具，基于将视频转换为噪声、重新采样实现视频编辑，支持局部编辑和视频转视频功能。用户能调整噪声校正强度、对齐强度等参数控制视频效果，与ComfyUI-MochiWrapper节点结合使用，实现更复杂的编辑需求。ComfyUI-MochiEdit安装简便，无需额外依…
工具测评
- 1
- 0
AI逻界7月16日
ItiNera – 港大与MIT联合推出的AI城市行程规划（OUIP）系统

ItiNera项目简介 ItiNera 是港大和MIT联合开发的智能城市行程规划系统。基于大型语言模型（LLM）和空间优化技术，根据用户的个性化需求，如情侣酒吧、二次元圣地等，一键生成Citywalk路线。系统包含五大模块：用户兴趣点数据库构建、请求解析、偏好感知兴趣点检索、聚类感知空间优化和行程生成。ITINERA在多个城市数据集上训练，能提供实时更新的POI和活动信息，确保行程空间连贯且符合用…
工具测评
- 1
- 0
AI逻界7月16日
MagicQuill – 蚂蚁集团联合多所高校共同开源的AI互动式图像编辑工具

MagicQuill项目简介 MagicQuill是香港科技大学、蚂蚁集团、浙江大学和香港大学共同推出的开源AI互动式图像编辑工具。基于用户友好的界面和AI支持的智能建议，实现精确的局部图像编辑。用户用简单的笔触和提示词，轻松添加元素、擦除物体或改变颜色，让图像编辑变得简单、智能且高效。 MagicQuill优势介绍 AI支持的智能建议：基于AI算法预测用户意图，提供编辑建议，简化操作流程。精确…
工具测评
- 0
- 0
AI逻界7月12日
TimeSuite – 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

TimeSuite项目简介 TimeSuite是上海AI Lab推出的新型框架，能提升多模态大型语言模型（MLLMs）在长视频理解任务中的表现。基于引入高效的长视频处理框架、高质量的视频数据集TimePro用在定位调整，及名为Temporal Grounded Caption的指令调谐任务，明确地将定位监督纳入传统问答格式中。TimeSuite能增强模型对视频内容的时间感知能力，减少幻觉风险，且在…
工具测评
- 0
- 0
AI逻界7月5日
ChatUI – 阿里推出的开源智能对话式 UI 组件库

ChatUI项目简介 ChatUI 是阿里团队推出的开源智能对话式 UI 组件库，能帮助开发者快速构建高质量的聊天应用，提供响应式设计、国际化、主题定制等功能。ChatUI 基于阿里巴巴 Alime Chatbot 的最佳实践，用 TypeScript 编写，支持无障碍功能，兼容多种浏览器。ChatUI 提供丰富的组件，如气泡、输入框等，满足不同场景需求。开发者基于简单配置实现多语言支持，打造符合…
工具测评
- 3
- 0
AI逻界7月1日
AutoDroid-V2 – 清华推出的移动端GUI自动化脚本代理

AutoDroid-V2项目简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言模型（SLM）的移动端GUI自动化脚本代理，能基于代码生成技术提升设备上的GUI代理性能。AutoDroid-V2分析应用的探索历史，自动生成精细的应用文档，指导SLM生成多步脚本完成复杂的用户任务。与传统的逐步GUI代理相比，AutoDroid-V2显著提高了任务完成率和执行效率，减少对大型云…
工具测评
- 5
- 0
AI逻界6月27日
ComfyUI-Copilot – 阿里推出基于 ComfyUI 的 AI 智能助手

ComfyUI-Copilot项目简介 ComfyUI-Copilot 是阿里巴巴国际数字商业集团（AIDC-AI）推出基于 ComfyUI 框架深度开发的 AI 智能助手。ComfyUI-Copilot给予自然语言交互，为用户提供节点推荐、工作流构建辅助、模型查询等功能，降低 ComfyUI 的使用门槛，提升开发效率。帮助初学者和资深开发者，借助智能 Q&A 平台和实时交互支持，快速解决…
工具测评
- 3
- 0
AI逻界6月23日
aisuite – 吴恩达发布开源Python库，一个接口调用多个大模型

aisuite项目简介 aisuite是开源的Python库，吴恩达（Andrew Ng）发布的，旨在提供一个统一的接口来调用多个大型语言模型（LLM）服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台，开发者能轻松切换和测试不同提供商的模型。通过aisuite，用户可以便捷地获取API密钥并设置环境变量，实现对不同语言模型的访问和调用。简化了多模型管理和测试的工作，…
工具测评
- 2
- 0
AI逻界6月18日
AI绘画进阶入门ComfyUI系列教程第七章，Cn应用与神奇的视觉编码！

【视频简介】关于ControlNet应用的教程。视频首先介绍了ControlNet在webUI中的应用,以及与之前SD界面的结合使用。接着详细讲解了ControlNet的原理和处理核心以及高级选项的使用。然后介绍了预处理图像需要使用的节点以及一些后期处理的小节点。最后介绍了ControlNet的集成的处理器可以方便地调用各种预处理节点。视频内容详细适合初学者入门。【视频时间线】 CONVI系列…
AI教程
- 6
- 0
AI逻界6月14日
ShotAdapter – Adobe联合UIUC推出的多镜头视频生成框架

ShotAdapter项目简介 ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架，基于微调预训练的文本到视频模型，引入过渡标记和局部注意力掩码策略，实现对多镜头视频的生成。框架能确保角色在不同镜头中的身份一致性，支持用户用特定的文本提示控制镜头的数量、时长和内容。ShotAdapter推出从单镜头视频数据集中构建多镜头视频数据集的新方法，基于采样、分割和拼接视频片…
工具测评
- 5
- 0
AI逻界6月13日
Midscene.js – AI驱动的 UI 自动化测试框架

Midscene.js项目简介 Midscene.js是基于AI技术的自动化SDK，通过用大型语言模型（LLM）简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式，Midscene.js将执行相应的操作。Midscene.js支持执行动作、查询数据和页面断言，减少脚本维护成本，提供可视化报告。Midscene.js是一个开源项目，能在用户自己的环境下运行，确保数据安全。 Mids…
工具测评
- 3
- 0
AI逻界6月9日