-
ImagePulse – 魔搭社区开源的图像理解和生成模型数据集
ImagePulse项目简介 ImagePulse (图律脉动)是魔搭社区推出的开源项目,为下一代图像理解和生成模型提供数据集支持,通过原子化模型的能力并构建原子能力数据集。项目包含多个原子能力数据集,例如“修改、添加、移除”“放大、缩小”“风格迁移”和“人脸保持”等,每个数据集都针对特定的图像编辑或生成任务。 ImagePulse优势介绍 原子能力数据集构建:ImagePulse 提供了多种针对…- 1
-
夸克灵知大模型 – 夸克推出的AI学习大模型
夸克灵知大模型项目简介 夸克灵知大模型是夸克公司全新推出的智能学习大模型,具备博士生级别的推理能力。基于AI技术为用户提供分步骤题目讲解,能随时回答问题。在考研数学等题目的正确率和得分率上,夸克灵知大模型已经能与OpenAI的o1模型相媲美,远超国内其他模型。模型能帮助用户提升学习能力和效率,实现从解决一道题到掌握一类题的转变。 夸克灵知大模型优势介绍 智能搜题与解题:用户搜索各类新题和难题,获得…- 4
-
InternVL3 – 上海 AI Lab 开源的多模态大语言模型
InternVL3项目简介 InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时处理文字、图片、视频等多种信息。 InternVL3采用了创新的原生多模态预训练方法,将语言和多模态学习整合到同一个预训练阶段,提升了多模态能力的同时,进一步增强了纯语言能力。模型通过混合偏好优化算法和多模态测试…- 4
-
Perplexica – 开源AI搜索引擎,支持多种搜索模式、实时信息更新
Perplexica项目简介 Perplexica是开源的AI驱动搜索引擎,是Perplexity AI的开源替代品。基于机器学习算法和自然语言处理技术理解用户查询,提供精确答案。Perplexica支持多种搜索模式,包括全网搜索、写作助手、学术搜索、YouTube搜索、Wolfram Alpha搜索和Reddit搜索。Perplexica支持本地大型语言模型,用API将搜索功能集成到其他应用中,…- 2
-
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
Mureka V6项目简介 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术,使声场更加开阔,人声质感和混音设计进一步强化。用户可以通过简单的步骤使用Mureka V6创作音乐。生成的音乐可以自由使用,适用于YouTube、广告、游戏背景音乐等多种场景。Mureka V6支持多种…- 2
-
Voila – 开源端到端语音大模型,实现低延迟语音对话
Voila项目简介 Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom…- 0
-
PersonaTalk – 字节跳动推出的实现高保真和个性化视觉配音框架
PersonaTalk项目简介 PersonaTalk是字节跳动推出的基于注意力机制的两阶段框架,用在实现高保真度和个性化的视觉配音。PersonaTalk能在合成与目标音频精准唇形同步的视频的同时,保留说话者的独特说话风格和面部细节。第一阶段涉及风格感知的音频编码和唇形同步几何生成,第二阶段用双注意力面部渲染器渲染目标几何图形的纹理。PersonaTalk在视觉质量、唇形同步精度和个性保留方面展…- 1
-
OpenSPG – 蚂蚁联合OpenKG开源的知识图谱引擎
OpenSPG项目简介 OpenSPG是蚂蚁集团联合OpenKG社区推出的基于SPG框架的知识图谱引擎。OpenSPG融合LPG的结构性和RDF的语义性,克服RDF/OWL语义复杂难以落地的问题,继承LPG结构简单与大数据体系兼容的优势。OpenSPG提供明确的语义表示、逻辑规则定义和算子框架等能力,支持各厂商可插拔的适配基础引擎和算法服务,构建自定义的解决方案。OpenSPG用高效的知识化转换,…- 1