-
Casevo – 中国传媒大学推出的开源社会传播模拟系统
Casevo项目简介 Casevo(Cognitive Agents and Social Evolution Simulator)是中国传媒大学数据科学与智能媒体传播学院、中国传媒大学媒体融合与传播国家重点实验室联合推出的开源社会传播模拟系统。结合大语言模型和多智能体技术,基于模拟人类认知、决策和社会交互理解和预测社会传播现象。Casevo用模块化架构,支持从场景设置到复杂社会网络建模的完整仿真…- 2
- 0
-
Multi-SWE-bench – 字节豆包开源的多语言代码修复基准
Multi-SWE-bench项目简介 Multi-SWE-bench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript、JavaScript、Go、Rust、C和C++,是真正面向“全栈工程”的评测基准。数据集包含1632个真实修复任务,均来自GitHub issue,经过严格筛选与人…- 2
- 0
-
Matryoshka Diffusion Models – 苹果开源高清图像和视频生成的扩散模型
Matryoshka Diffusion Models项目简介 Matryoshka Diffusion Models(MDM)是苹果公司推出的一种创新的扩散模型,主要用于生成高分辨率图像和视频。MDM通过多分辨率扩散过程,在不同尺度上同时进行去噪,有效提升模型的训练效率和生成质量。基于NestedUNet架构,实现小尺度特征到大尺度结构的嵌套,促进不同分辨率间的信息共享。MDM特别适用于计算资源…- 1
- 0
-
Baichuan-Audio – 百川智能开源的端到端语音交互模型
Baichuan-Audio项目简介 Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码本离散化技术将音频信号转化为离散标记,保留语义和声学信息,用独立的音频头增强音频特征处理能力。模型基于两阶段预训练策略,结合交错数据训练,平衡音频建模和语言理解能力。Baichuan-Au…- 1
- 0
-
Oliva – 开源语音RAG助手,实时语音搜索向量数据库
Oliva项目简介 Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时搜索信息。用户基于自然语音提问,Oliva 用语音转文本和实时语音通信技术,将语音指令转化为对数据库的查询,返回结构化结果。Oliva支持多智能体协作,将复杂问题拆解为多个子任务,由不同智能体处理。…- 2
- 0
-
Qwen2-VL – 阿里巴巴达摩院开源的视觉多模态AI模型
Qwen2-VL项目简介 Qwen2-VL是阿里巴巴达摩院开源的视觉多模态AI模型,具备高级图像和视频理解能力。Qwen2-VL支持多种语言,能处理不同分辨率和长宽比的图片,实时分析动态视频内容。Qwen2-VL在多语言文本理解、文档理解等任务上表现卓越,适用于多模态应用开发,推动了AI在视觉理解和内容生成领域的进步。 Qwen2-VL优势介绍 图像理解:显著提高模型理解和解释视觉信息的能力,为图…- 0
- 0
-
HuggingChat macOS – Hugging Face开源的macOS聊天应用程序
HuggingChat macOS项目简介 HuggingChat macOS是Hugging Face推出的开源聊天应用程序,专为macOS用户设计,基于强大的开源语言模型,将先进的AI对话能力直接带到用户的桌面上。应用支持多种顶尖的开源大语言模型,如Qwen 2.5 72B、Command R+、Phi 3.5、Mistral 12B等。HuggingChat macOS提供丰富的功能,包括网…- 1
- 0
-
FastExcel – 开源的高性能 Excel 处理工具
FastExcel项目简介 FastExcel是基于Java的开源库,提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel,提供性能优化、bug修复,新增如读取指定行数和转换为PDF功能。FastExcel以MIT协议发布,适用于任何商业场景,基本高性能读写、简单易用API和流式操作能力,适合处理大规模数据。支持无缝从EasyExcel迁移,简化E…- 3
- 0
-
NotebookMLX – 将PDF文档转换成音频博客开源版的NotebookLM
NotebookMLX项目简介 NotebookMLX是开源版本的NotebookLM,集成NotebookLlama的功能,能将PDF文档转换成易于理解和分享的音频播客形式。项目基于MLX技术实现自然语言处理功能,包括PDF预处理、制作播客文本、文本重写及文本到语音转换,让内容的传播和消费更加便捷。NotebookMLX能提高信息的可访问性,让知识分享变得更加广泛和高效。 NotebookMLX…- 2
- 0
-
NodeRAG – 开源基于异构图的智能检索与生成系统
NodeRAG项目简介 NodeRAG 是基于异构图的检索增强生成(Retrieval-Augmented Generation,RAG)系统。通过构建包含多种节点类型的异构图,将文档信息和语言模型生成的见解整合在一起,支持多跳检索和细粒度信息提取。NodeRAG 的异构图包含实体、关系、语义单元等多种节点类型,能实现上下文感知的检索,显著提升检索准确性和效率。支持增量更新,能动态适应数据变化,通…- 1
- 0
-
See3D – 智源研究院开源的无标注视频学习3D生成模型
See3D项目简介 See3D(See Video, Get 3D)是北京智源人工智能研究院推出的3D生成模型,能基于大规模无标注的互联网视频进行学习,实现从视频中生成3D内容。与传统依赖相机参数的3D生成模型不同,See3D采用视觉条件技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。避免了昂贵的3D或相机标注的需求,能高效地从互联网视频中学习3D先验。See3D支持从文本、单…- 1
- 0
-
Hugging Face进军人形机器人市场:推出售价3000美元的开源机器人HopeJR
人工智能开发平台Hugging Face周四正式进军机器人硬件领域,发布了两款开源人形机器人产品,旨在打破大型科技公司对机器人技术的垄断。 两款新品各有特色 该公司推出的两款机器人分别针对不同应用场景:HopeJR是一款全尺寸人形机器人,配备66个驱动自由度,具备完整的行走和手臂操作能力;Reachy Mini则是一款桌面级机器人,专注于头部运动、语音交互和AI应用测试。 在定价方面,HopeJR…- 3
- 0
-
AutoGen Studio – 微软开源的零代码构建多智能体系统的AI工具
AutoGen Studio项目简介 AutoGen Studio 是微软研究院推出的一款开源界面工具,旨在简化多智能体系统的构建、调试和评估过程。AutoGen Studio提供一个基于 Web 的交互式界面和 Python API,支持用户拖放和声明式规范定义智能体及工作流,无需编写代码。AutoGen Studio 支持快速原型设计、交互式评估、可重用组件库,鼓励社区协作和共享。AutoGe…- 1
- 0
-
蚂蚁开源轻量级MoE推理模型Ring-lite
近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。 Ring-lite以蚂蚁技术此前发布的Ling-lite-1.5为起点,该模型采用MoE架构,总参数为16.8B,但激活参数仅2.75B。凭借独创的C3PO强化学习训练方法,Ring-lite在AIME24/25、LiveCo…- 2
- 0
-
Omnitool – 开源 AI 桌面,支持多种主流AI平台和服务
Omnitool项目简介 Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windows或Linux设备上安装,数据存储在本地,保障隐私安全。基于集成OpenAI、Stable Diffusion、Hugging Face等主流AI平台,用户无需复杂配置或学习API文档,可快速生成图像、翻译文本、创建音频等。O…- 2
- 0
-
Surya – 开源的OCR工具包,支持90+语言、布局分析等识别
Surya项目简介 Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya因高效的表格识别能力而闻名,性能优于许多现有的开源模型,如Table Transformer。Surya完全免费且用于商业用途,支持跨平台运行…- 0
- 0
-
OpenAI 推迟首个开源大模型发布,确保安全性成首要任务
近日,OpenAI 宣布将推迟原定于下周发布的首个开源权重大模型。OpenAI 的 CEO Sam Altman 表示,此次延迟的主要原因是为了进行更全面的安全测试和对高风险领域的审查。他强调,一旦模型权重公开,就无法撤回,而这款新模型对于 OpenAI 而言也是一个全新的挑战,因此他们希望确保一切都能做到尽善尽美。 OpenAI 的研究副总裁 Aidan Clark,作为本次开源项目的负责人,也…- 2
- 0
-
Rowboat – 开源AI编程工具,快速构建多智能体助手
Rowboat项目简介 Rowboat 是开源的低代码 AI IDE,专注于构建多智能体助手的 MCP(多云平台)工具。通过可视化界面和 AI 辅助开发功能,帮助用户快速设计、配置和测试智能体工作流程。用户可以用自然语言描述需求,Rowboat 的 AI Copilot 能自动生成智能体结构和工具配置,支持实时交互测试。Rowboat 支持灵活的工具集成,可连接到多种 MCP 工具,为智能体赋予特…- 0
- 0
-
Eko – Fellou AI 推出的开源 AI 代理开发框架
Eko项目简介 Eko是Fellou AI推出的生产就绪型JavaScript框架,基于自然语言驱动的方式,帮助开发者轻松创建从简单指令到复杂流程的可靠智能代理。Eko支持所有平台,包括计算机桌面环境和浏览器环境,提供统一且便捷的操作界面。Eko将自然语言指令转化为复杂的工作流程,具备高度的可干预性,支持开发者在执行过程中随时调整。Eko API设计简洁明了,文档齐全,易于上手,适合不同水平的开发…- 1
- 0
-
OLMo 2 32B – Ai2 推出的最新开源语言模型
OLMo 2 32B项目简介 OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超越 GPT-3.5-Turbo 和 GPT-4o-mini 的完全开放模型,性能接近 Qwen-2.5-72B 等更大规模模型。 模型采用高效的训练策略,通过预训练、中训练和后训练…- 1
- 0
-
Skywork o1 – 昆仑万维推出的天工大模型4.0 o1版
Skywork o1项目简介 Skywork o1是昆仑万维推出的天工大模型4.0 o1版,是国内首款具备中文逻辑推理能力的o1模型。Skywork o1在模型输出中内生了思考、计划、反思等能力,显著提升推理能力。Skywork o1模型包括基于开源Llama 3.1 8B的模型和进阶能力更强的版本,推动AI深度思考和复杂推理能力的发展,是追求AGI(人工通用智能)的重要一步。 Skywork o…- 0
- 0
-
FinRobot – 开源 AI Agent 平台,解决金融领域应用的综合解决方案
FinRobot项目简介 FinRobot是开源的AI代理平台,专注于金融领域的应用。基于大型语言模型(LLMs)来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链(CoT)提示功能,将难题分解成逻辑步骤,增强分析能力。FinRobot通过开源项目,让更多人能访问和使用金融专业LLM工具,促进AI在金融决策中的广泛应用。架构包括金融AI代理层、金融LLM算法层、LLMOps和Data…- 0
- 0
-
Step-Audio – 阶跃星辰开源的语音交互模型
Step-Audio项目简介 Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。Step-Audio基于130B参数的统一模型,将语音理解与生成相结合,支持语音识别、对话、语音合成等功能。Step-Audio 的核心优势包括:高效的语音数据生成引擎、支持多种情感和方言的精细语音控制能…- 1
- 0
-
阿里开源ThinkSound:AI自动为视频加音效,影视与游戏创作迎来大变革!
2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面内容,为影视制作、游戏开发及多媒体创作注入全新活力。AIbase结合最新信息,深入剖析ThinkSound的独特优势与行业影响,带您一探AI音效生成的新前沿。 ThinkSound:AI“音效师”惊艳亮…- 1
- 0