-
高考摸底大模型测评丨GPT-4o全面领先,国产大模型豆包文科成绩优势明显
什么?好多大模型的文科成绩超一本线,还是最卷的河南省??? 没错,最近就有这么一项大模型“高考大摸底”评测走红了。 河南高考文科今年的一本线是521分,根据这项评测,共计四个大模型大于或等于这个分数,其中头两名最值得关注: GPT-4o:562分 字节豆包:542.5分 …… 从结果中来看,GPT-4o的表现依旧是处于领先状态,而在国产大模型这边…- 2
-
ScrapeGraphAI – AI网络爬虫工具,自动分析目标网页结构提取关键数据
ScrapeGraphAI项目简介 ScrapeGraphAI 是基于大型语言模型(LLM)驱动的智能网络爬虫工具包,专注于从各类网站和HTML内容中高效提取结构化数据。具备三大核心功能:SmartScraper可根据用户提示精准抓取网页中的结构化信息;SearchScraper基于AI驱动的搜索技术从搜索引擎结果中提取关键信息;Markdownify可将网页内容快速转换为整洁的Markdown格…- 5
-
ScaleMCP – 普华永道推出的动态MCP工具检索器
ScaleMCP项目简介 ScaleMCP是普华永道推出的工具选择方法,动态的为大型语言模型(LLM)Agents 配备Model Context Protocol(MCP)工具。基于自动同步工具存储系统与MCP服务器,解决现有框架依赖手动更新本地工具库导致的低效和不一致问题。ScaleMCP的核心是自动同步工具索引管道,基于CRUD操作(创建、读取、更新、删除)确保工具存储与MCP服务器保持一致…- 2
-
Prometheus – 浙大联合蚂蚁等高校推出的3D感知潜在扩散模型
Prometheus项目简介 Prometheus是创新的3D感知潜在扩散模型,专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别的3D生成,同时保持高质量的输出和良好的泛化能力。核心在于基于2D先验知识来驱动高效且可泛化的3D合成过程。通过将3D场景生成表述为多视图、前馈、像素对齐的3D高斯生成过程,在潜在扩散范式内进行操作,Prometheus能有效地从文本描述中生成具有丰富…- 4
-
MagicMan – 腾讯联合多所高校推出2D图像生成3D人类模型的AI项目
MagicMan项目简介 MagicMan 是清华大学深圳国际研究生院、腾讯AI实验室、香港科技大学、斯坦福大学和香港中文大学的研究团队共同推出的AI项目,专注于基于深度学习技术从单张2D图像生成高质量的3D人类模型。结合预训练的2D扩散模型和参数化的SMPL-X模型,通过混合多视角注意力机制和迭代细化策略,实现精确的3D感知和图像生成。在游戏、电影、虚拟现实等多个领域具有广泛的应用潜力。 Mag…- 0
-
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器
MiniMax MCP Server项目简介 MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简单的文本输入,可调用视频生成、图像生成、语音生成及声音克隆等多项前沿能力。平台具有强大的多模态功能,支持高分辨率视频、精细化图像和自然语音的生成,具备独特的声音克隆能力。 MiniMax MCP Server 兼容多种主流 MC…- 0
-
Agent TARS – 字节跳动开源的多模态 AI Agent 项目
Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力,成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段,仅支持 mac…- 4
-
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型
Audio-SDS项目简介 Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无需重新训练模型,可将任意预训练音频扩散模型转化为多功能工具,广泛应用于音效生成、音源分离、FM合成及语音增强等任务。Audio-SDS通过文本提示引导音频生成,支持高度定制化,满足…- 2