全部标签

工具测评

最新随机最多浏览最多喜欢

高考摸底大模型测评丨GPT-4o全面领先，国产大模型豆包文科成绩优势明显

什么?好多大模型的文科成绩超一本线，还是最卷的河南省??? 没错，最近就有这么一项大模型“高考大摸底”评测走红了。河南高考文科今年的一本线是521分，根据这项评测，共计四个大模型大于或等于这个分数，其中头两名最值得关注： GPT-4o：562分字节豆包：542.5分 …… 从结果中来看，GPT-4o的表现依旧是处于领先状态，而在国产大模型这边…
工具测评
- 2
5月26日
ScrapeGraphAI – AI网络爬虫工具，自动分析目标网页结构提取关键数据

ScrapeGraphAI项目简介 ScrapeGraphAI 是基于大型语言模型（LLM）驱动的智能网络爬虫工具包，专注于从各类网站和HTML内容中高效提取结构化数据。具备三大核心功能：SmartScraper可根据用户提示精准抓取网页中的结构化信息；SearchScraper基于AI驱动的搜索技术从搜索引擎结果中提取关键信息；Markdownify可将网页内容快速转换为整洁的Markdown格…
工具测评
- 5
5月26日
ScaleMCP – 普华永道推出的动态MCP工具检索器

ScaleMCP项目简介 ScaleMCP是普华永道推出的工具选择方法，动态的为大型语言模型（LLM）Agents 配备Model Context Protocol（MCP）工具。基于自动同步工具存储系统与MCP服务器，解决现有框架依赖手动更新本地工具库导致的低效和不一致问题。ScaleMCP的核心是自动同步工具索引管道，基于CRUD操作（创建、读取、更新、删除）确保工具存储与MCP服务器保持一致…
工具测评
- 2
6月15日
Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型

Prometheus项目简介 Prometheus是创新的3D感知潜在扩散模型，专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别的3D生成，同时保持高质量的输出和良好的泛化能力。核心在于基于2D先验知识来驱动高效且可泛化的3D合成过程。通过将3D场景生成表述为多视图、前馈、像素对齐的3D高斯生成过程，在潜在扩散范式内进行操作，Prometheus能有效地从文本描述中生成具有丰富…
工具测评
- 4
6月15日
MagicMan – 腾讯联合多所高校推出2D图像生成3D人类模型的AI项目

MagicMan项目简介 MagicMan 是清华大学深圳国际研究生院、腾讯AI实验室、香港科技大学、斯坦福大学和香港中文大学的研究团队共同推出的AI项目，专注于基于深度学习技术从单张2D图像生成高质量的3D人类模型。结合预训练的2D扩散模型和参数化的SMPL-X模型，通过混合多视角注意力机制和迭代细化策略，实现精确的3D感知和图像生成。在游戏、电影、虚拟现实等多个领域具有广泛的应用潜力。 Mag…
工具测评
- 0
6月26日
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器

MiniMax MCP Server项目简介 MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议（MCP）的多模态生成服务器。通过简单的文本输入，可调用视频生成、图像生成、语音生成及声音克隆等多项前沿能力。平台具有强大的多模态功能，支持高分辨率视频、精细化图像和自然语音的生成，具备独特的声音克隆能力。 MiniMax MCP Server 兼容多种主流 MC…
工具测评
- 0
6月17日
Agent TARS – 字节跳动开源的多模态 AI Agent 项目

Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容，与浏览器、命令行和文件系统无缝集成，实现复杂任务的规划与执行。Agent TARS 提供桌面客户端，展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力，成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段，仅支持 mac…
工具测评
- 4
6月26日
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS项目简介 Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域带来了重大突破。无需重新训练模型，可将任意预训练音频扩散模型转化为多功能工具，广泛应用于音效生成、音源分离、FM合成及语音增强等任务。Audio-SDS通过文本提示引导音频生成，支持高度定制化，满足…
工具测评
- 2
5月26日