全部标签

工具测评

最新随机最多浏览最多喜欢

ImagePulse – 魔搭社区开源的图像理解和生成模型数据集

ImagePulse项目简介 ImagePulse （图律脉动）是魔搭社区推出的开源项目，为下一代图像理解和生成模型提供数据集支持，通过原子化模型的能力并构建原子能力数据集。项目包含多个原子能力数据集，例如“修改、添加、移除”“放大、缩小”“风格迁移”和“人脸保持”等，每个数据集都针对特定的图像编辑或生成任务。 ImagePulse优势介绍原子能力数据集构建：ImagePulse 提供了多种针对…
工具测评
- 1
6月22日
夸克灵知大模型 – 夸克推出的AI学习大模型

夸克灵知大模型项目简介夸克灵知大模型是夸克公司全新推出的智能学习大模型，具备博士生级别的推理能力。基于AI技术为用户提供分步骤题目讲解，能随时回答问题。在考研数学等题目的正确率和得分率上，夸克灵知大模型已经能与OpenAI的o1模型相媲美，远超国内其他模型。模型能帮助用户提升学习能力和效率，实现从解决一道题到掌握一类题的转变。夸克灵知大模型优势介绍智能搜题与解题：用户搜索各类新题和难题，获得…
工具测评
- 4
7月10日
InternVL3 – 上海 AI Lab 开源的多模态大语言模型

InternVL3项目简介 InternVL3是上海人工智能实验室开源的多模态大型语言模型（MLLM），具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本，能同时处理文字、图片、视频等多种信息。 InternVL3采用了创新的原生多模态预训练方法，将语言和多模态学习整合到同一个预训练阶段，提升了多模态能力的同时，进一步增强了纯语言能力。模型通过混合偏好优化算法和多模态测试…
工具测评
- 4
6月7日
Perplexica – 开源AI搜索引擎，支持多种搜索模式、实时信息更新

Perplexica项目简介 Perplexica是开源的AI驱动搜索引擎，是Perplexity AI的开源替代品。基于机器学习算法和自然语言处理技术理解用户查询，提供精确答案。Perplexica支持多种搜索模式，包括全网搜索、写作助手、学术搜索、YouTube搜索、Wolfram Alpha搜索和Reddit搜索。Perplexica支持本地大型语言模型，用API将搜索功能集成到其他应用中，…
工具测评
- 2
6月11日
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型

Mureka V6项目简介 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型，支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL（in-context learning）技术，使声场更加开阔，人声质感和混音设计进一步强化。用户可以通过简单的步骤使用Mureka V6创作音乐。生成的音乐可以自由使用，适用于YouTube、广告、游戏背景音乐等多种场景。Mureka V6支持多种…
工具测评
- 2
7月2日
Voila – 开源端到端语音大模型，实现低延迟语音对话

Voila项目简介 Voila 是开源的端到端语音大模型，专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力，能直接处理语音输入并生成语音输出，为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力，支持数百万种预构建和自定义声音，用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。包含两个主要模型：Voila-e2e 用于端到端语音对话，Voila-autonom…
工具测评
- 0
6月23日
PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架

PersonaTalk项目简介 PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架，用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时，保留说话者的独特说话风格和面部细节。第一阶段涉及风格感知的音频编码和唇形同步几何生成，第二阶段用双注意力面部渲染器渲染目标几何图形的纹理。PersonaTalk在视觉质量、唇形同步精度和个性保留方面展…
工具测评
- 1
6月16日
OpenSPG – 蚂蚁联合OpenKG开源的知识图谱引擎

OpenSPG项目简介 OpenSPG是蚂蚁集团联合OpenKG社区推出的基于SPG框架的知识图谱引擎。OpenSPG融合LPG的结构性和RDF的语义性，克服RDF/OWL语义复杂难以落地的问题，继承LPG结构简单与大数据体系兼容的优势。OpenSPG提供明确的语义表示、逻辑规则定义和算子框架等能力，支持各厂商可插拔的适配基础引擎和算法服务，构建自定义的解决方案。OpenSPG用高效的知识化转换，…
工具测评
- 1
6月23日