全部标签

工具测评

最新随机最多浏览最多喜欢

Dify-Plus – 基于 Dify 二次开发的企业级增强版项目

Dify-Plus项目简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录鉴权、应用中心等功能，优化了权限管理，适合企业场景使用。Dify-Plus项目开源，解决行业痛点，适合需要在企业场景中对资源进行精细化管理的用户使用。 Dify-Plus优势介…
工具测评
- 12
7月5日
FramePainter – 哈工大联合华为诺亚推出的交互式图像编辑AI工具

FramePainter项目简介 FramePainter 是基于 AI 的交互式图像编辑工具，通过结合视频扩散模型和直观的草图控制，让用户能通过简单的绘制、点击或拖动操作来指示编辑意图，实现对图像的精确修改。FramePainter 的核心优势在于其高效的训练机制和强大的泛化能力，即使在少量样本的情况下，也能生成高质量的编辑结果。 FramePainter优势介绍直观的草图控制：用户可以通过在…
工具测评
- 0
7月5日
TimeSuite – 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架

TimeSuite项目简介 TimeSuite是上海AI Lab推出的新型框架，能提升多模态大型语言模型（MLLMs）在长视频理解任务中的表现。基于引入高效的长视频处理框架、高质量的视频数据集TimePro用在定位调整，及名为Temporal Grounded Caption的指令调谐任务，明确地将定位监督纳入传统问答格式中。TimeSuite能增强模型对视频内容的时间感知能力，减少幻觉风险，且在…
工具测评
- 0
7月5日
PaperBench – OpenAI 开源的 AI 智能体评测基准

PaperBench项目简介 PaperBench是OpenAI开源的AI智能体评测基准，支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验，全面展现从理论到实践的自动化能力。PaperBench包含8316个评分节点，基于层次化评分标准，用自动评分系统提高效率。评测结果显示，目前主流AI模型在复现任务中表现不如顶级机器学习专家，表明智能体在长期…
工具测评
- 0
7月5日
LLaMA-Mesh – 清华联合英伟达推出的自然语言生成复杂的3D模型项目

LLaMA-Mesh项目简介 LLaMA-Mesh是清华大学和NVIDIA共同推出的项目，基于将3D网格生成与大型语言模型（LLMs）结合，实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换为文本，基于顶点量化技术优化处理，让模型能理解和生成3D网格。LLaMA-Mesh能生成高质量的3D网格，保持强大的语言理解和生成能力，为3D内容创作提供一种更直观、高效…
工具测评
- 2
7月4日
BALROG – 基准测试工具，用于评估LLMs和VLMs在复杂动态环境中的推理能力

BALROG项目简介 BALROG是评估大型语言模型（LLMs）和视觉语言模型（VLMs）在游戏上的推理能力，特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏环境，包括程序生成的环境如NetHack，测试模型性能。BALROG揭示了现有模型在简单任务上的成功和在复杂任务上的挑战，尤其是在涉及视觉决策时。BALROG提供开放和细粒度的评估框架，推动自主代理研究的进展。 BAL…
工具测评
- 3
7月4日
百度文库AI智能化升级全面测评：办公族学生党超级利好！只需30秒，一句话轻松造出精美PPT

文章来源丨智东西大学结课作业、工作项目汇报……都离不开PPT制作。但你有测算过自己完成一份工作或学习PPT的时间吗？毫无疑问，时间单位必然以小时甚至天来计算。现在，你可以仅花费不到一分钟的时间，就能快速生成一份堪称完美的PPT。这个工具就是你一直耳熟能详的百度文库，在大模型的赋能下，现在已经转型为“一站式智能文档平台”。大模型时代，百度文…
工具测评
- 1
7月4日
InternVL – OpenGVLab 推出的多模态大模型

InternVL项目简介 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型，专注于视觉与语言任务。采用 ViT-MLP-LLM 架构，通过视觉模块（如 InternViT）和语言模块（如 InternLM）的融合，实现视觉与语言的深度结合。InternVL 基于海量网络级图像-文本数据训练，支持多种模态输入，如图像、视频、文本，能生成多语言输出。 InternVL优势…
工具测评
- 3
7月4日