-
LLaMA-Omni – 中科院推出的低延迟高质量的语音交互模型
LLaMA-Omni项目简介 LLaMA-Omni 是中国科学院计算技术研究所和中国科学院大学研究者推出的新型模型架构,用于实现与大型语言模型(LLM)的低延迟、高质量语音交互。通过集成预训练的语音编码器、语音适配器、大型语言模型(LLM)和一个实时语音解码器,直接从语音指令中快速生成文本和语音响应,省略传统的必须先将语音转录为文本的步骤,提高了响应速度。模型基于最新的 LLaMA-3.1-8B-…- 1
-
APB – 清华联合腾讯等机构推出的分布式长上下文推理框架
APB项目简介 APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks across GPUs)是清华大学等机构联合提出的分布式长上下文推理框架。通过稀疏注意力机制和序列并行推理方式,有效解决了大模型处理长文本时的效率瓶颈。APB采用更小的Anchor block和Passin…- 1
-
1分钟诞生一个全新GPTs!上线仅三天涌现上千款定制GPTs:理想型男友、科研利器要啥有啥
1分钟诞生一个新的GPT!不到一周的时间,各种定制GPTs全球大爆发,增长速度已经完全超乎所有人的想象。 这恰恰,印证了奥特曼在OpenAI开发者大会所说的一句话,「我们正在孕育新物种,它们正在迅速增殖。」 全网都在唱衰Agent初创公司,甚至就连开发者的研究方向将要发生翻天覆地的变化。 另一边,Karpathy一条推文推波助澜,更是暴露了OpenAI的野心——让GPT模型成为大模型的操作系统。 …- 1
-
MiniCPM 3.0 – 面壁智能开源的端侧AI模型,4B参数性能超越GPT-3.5
MiniCPM 3.0项目简介 MiniCPM 3.0是面壁智能推出的一款高性能端侧AI模型,具备4B参数,以较小的模型规模实现了超越GPT-3.5的性能表现。MiniCPM 3.0采用LLMxMapReduce技术,支持无限长文本处理,有效扩展了模型的上下文理解能力。在Function Calling方面,MiniCPM 3.0的性能接近GPT-4o,展现了出色的端侧执行能力。MiniCPM 3…- 1
-
UNO – 字节跳动推出的创新AI图像生成框架
UNO项目简介 UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变换器生成高一致性的多主体数据,采用渐进式跨模态对齐技术,分阶段训练模型,逐步提升生成效果。引入了通用旋转位置嵌入(UnoPE),支持多种分辨率和长宽比的图像生成。 UNO优势介绍 单主体定制生成:U…- 1
-
GitHub MCP Server – GitHub推出基于 MCP 的服务器工具
GitHub MCP Server项目简介 GitHub MCP Server 是GitHub 官方推出的基于 Model Context Protocol (MCP) 的服务器工具,GitHub MCP Server能无缝集成 GitHub API,为开发者提供高级自动化和交互功能。支持开发者轻松实现自动化工作流,例如自动化处理 GitHub 仓库中的问题、Pull Request,及提取和分析…- 1
-
Kimi连夜上线PPT生成功能测评18款AIPPT产品
昨天,Kimi毫无预兆的发了一个公告。 然后我就被刷屏了。 PPT这玩意,确实比什么AI绘图、AI视频什么的,都要刚需。 是无论是社畜还是大学牲,都逃不开的东西。 而制作一份优秀的PPT,真的不容易。构思、排版、设计...每一步都需要投入大量时间和精力。 记得我之前去演讲,一个PPT,要做十几天。。。 但是对于很多普通人来说,PPT其实就是个交差的玩意。 在我心中PPT有两种,一种是演讲型PPT,…- 1
-
MiniPerplx – AI 搜索引擎,基于 Grok 2.0 模型
MiniPerplx项目简介 MiniPerplx 是开源的 AI 搜索引擎,基于 Grok 2.0 模型进行搜索。MiniPerplx提供了免费的替代方案,用在搜索网页、推特帖子、研究论文和 YouTube 视频等内容。MiniPerplx 的技术构建包括 Next.js、Vercel AI SDK 等,具备网页搜索、代码解释器、天气预报、URL 摘要和位置搜索等功能。用户能在 GitHub 上…- 1