-
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目
Dify-Plus项目简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录鉴权、应用中心等功能,优化了权限管理,适合企业场景使用。Dify-Plus项目开源,解决行业痛点,适合需要在企业场景中对资源进行精细化管理的用户使用。 Dify-Plus优势介…- 12
-
FramePainter – 哈工大联合华为诺亚推出的交互式图像编辑AI工具
FramePainter项目简介 FramePainter 是基于 AI 的交互式图像编辑工具,通过结合视频扩散模型和直观的草图控制,让用户能通过简单的绘制、点击或拖动操作来指示编辑意图,实现对图像的精确修改。FramePainter 的核心优势在于其高效的训练机制和强大的泛化能力,即使在少量样本的情况下,也能生成高质量的编辑结果。 FramePainter优势介绍 直观的草图控制:用户可以通过在…- 0
-
TimeSuite – 上海AI Lab推出的提升MLLMs在长视频理解处理的设计框架
TimeSuite项目简介 TimeSuite是上海AI Lab推出的新型框架,能提升多模态大型语言模型(MLLMs)在长视频理解任务中的表现。基于引入高效的长视频处理框架、高质量的视频数据集TimePro用在定位调整,及名为Temporal Grounded Caption的指令调谐任务,明确地将定位监督纳入传统问答格式中。TimeSuite能增强模型对视频内容的时间感知能力,减少幻觉风险,且在…- 0
-
PaperBench – OpenAI 开源的 AI 智能体评测基准
PaperBench项目简介 PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验,全面展现从理论到实践的自动化能力。PaperBench包含8316个评分节点,基于层次化评分标准,用自动评分系统提高效率。评测结果显示,目前主流AI模型在复现任务中表现不如顶级机器学习专家,表明智能体在长期…- 0
-
LLaMA-Mesh – 清华联合英伟达推出的自然语言生成复杂的3D模型项目
LLaMA-Mesh项目简介 LLaMA-Mesh是清华大学和NVIDIA共同推出的项目,基于将3D网格生成与大型语言模型(LLMs)结合,实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换为文本,基于顶点量化技术优化处理,让模型能理解和生成3D网格。LLaMA-Mesh能生成高质量的3D网格,保持强大的语言理解和生成能力,为3D内容创作提供一种更直观、高效…- 2
-
BALROG – 基准测试工具,用于评估LLMs和VLMs在复杂动态环境中的推理能力
BALROG项目简介 BALROG是评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏环境,包括程序生成的环境如NetHack,测试模型性能。BALROG揭示了现有模型在简单任务上的成功和在复杂任务上的挑战,尤其是在涉及视觉决策时。BALROG提供开放和细粒度的评估框架,推动自主代理研究的进展。 BAL…- 3
-
百度文库AI智能化升级全面测评:办公族学生党超级利好!只需30秒,一句话轻松造出精美PPT
文章来源丨智东西 大学结课作业、工作项目汇报……都离不开PPT制作。但你有测算过自己完成一份工作或学习PPT的时间吗? 毫无疑问,时间单位必然以小时甚至天来计算。现在,你可以仅花费不到一分钟的时间,就能快速生成一份堪称完美的PPT。 这个工具就是你一直耳熟能详的百度文库,在大模型的赋能下,现在已经转型为“一站式智能文档平台”。 大模型时代,百度文…- 1
-
InternVL – OpenGVLab 推出的多模态大模型
InternVL项目简介 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViT-MLP-LLM 架构,通过视觉模块(如 InternViT)和语言模块(如 InternLM)的融合,实现视觉与语言的深度结合。InternVL 基于海量网络级图像-文本数据训练,支持多种模态输入,如图像、视频、文本,能生成多语言输出。 InternVL优势…- 3