-
Aria – Rhymes AI开源的多模态原生混合专家(MoE)模型
Aria项目简介 Aria是由Rhymes AI团队推出全球首个开源多模态原生混合专家(MoE)模型,能理解和处理文本、代码、图像和视频等多种输入模态。模型在多模态和语言任务上展现最佳性能,与专有模型竞争,保持轻量级和快速的特点。Aria拥有64K令牌的长上下文窗口能力,能高效处理复杂的长视频和文档数据。模型权重、代码库和技术报告均已开源。Aria的创新架构和训练方法,支持开发者和研究者在多模态A…- 0
-
Halo – 开源的DIY健康追踪项目,构建私人健康检测应用
Halo项目简介 Halo是开源的DIY健康追踪项目,基于低成本的智Halo – 开源的DIY健康追踪项目,构建私人健康检测应用能戒指和开源软件,让用户构建自己的私人健康监测应用。Halo支持活动追踪、心率监测、睡眠分析等功能,且完全尊重用户隐私。基于Halo,用户能深入了解自己的健康数据,享受定制化的健康追踪体验。项目代码开源,鼓励社区参与和贡献,推动健康追踪技术的普及和创新。 Halo优势介绍…- 1
-
START – 阿里联合中科大推出的自学推理模型
START项目简介 START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升大型语言模型(LLMs)的推理能力。START基于“Hint-infer”技术在推理过程中插入提示,激发模型使用外部工具,基于“Hint-RFT”框架进行自学习和微调。START在长链推理(Long…- 0
-
LTM-2-mini – Magic公司推出的支持1亿token上下文AI模型
LTM-2-mini项目简介 LTM-2-mini是Magic公司推出的支持1亿token上下文AI模型,能处理相当于1000万行代码或750本小说的内容。LTM-2-mini采用序列维度算法,计算效率比Llama 3.1 405B的注意力机制高出约1000倍,能够处理大规模代码库和相关文档,生成高质量代码,有望改变AI模型的运作方式。为了评估和优化模型的上下文处理能力,Magic团队设计了新的评…- 0
-
Mureka V6 – 昆仑万维推出的AI音乐创作基座模型
Mureka V6项目简介 Mureka V6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的AI音乐创作。引入自研的ICL(in-context learning)技术,使声场更加开阔,人声质感和混音设计进一步强化。用户可以通过简单的步骤使用Mureka V6创作音乐。生成的音乐可以自由使用,适用于YouTube、广告、游戏背景音乐等多种场景。Mureka V6支持多种…- 2
-
SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术
SmartEraser项目简介 SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”(Masked-Region Guidance)范式,与传统的“掩码和修复”(mask-and-inpaint)方法不同,SmartEraser保留掩码区域作为移除过程的引导,能更准确地识别和移除目标对象,同…- 0
-
Graphiti – 开源AI动态知识图谱生成框架
Graphiti项目简介 Graphiti 是为动态环境设计的 AI 知识图谱生成框架,为 AI 智能体构建能查询、具有时间感知能力的知识网络。Graphiti 能实时摄取和处理结构化与非结构化数据,支持动态数据整合、状态推理与自动化,及混合检索。Graphiti 适用于 AI 智能体记忆层、实时交互系统和企业知识管理等场景,为智能体提供强大的动态记忆和推理能力,助力实现更智能、更高效的 AI 应…- 0
-
BabelDOC – 开源 AI PDF 翻译工具,专为科学论文翻译设计
BabelDOC项目简介 BabelDOC 是开源的智能 PDF 翻译工具,专为科学论文翻译设计。能在原文旁生成翻译文本,形成双语对照,无需切换窗口,方便阅读。能完整保留数学公式、表格和图形,不破坏原文布局。BabelDOC 支持多种翻译引擎,兼容 OpenAI 模型 API,用户可自定义翻译模型,如 GPT-4 等。 BabelDOC优势介绍 双语对照:在原文旁直接生成翻译文本,形成双语对照,方…- 1