-
SWE-Kit – 构建自定义软件工程AI代理的开源框架
SWE-Kit项目简介 SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模型集成,降低构建复杂 AI 代理的门槛。SWE-Kit 集成文件操作、代码分析、shell 命令执行等功能,提高开发效率、提供高度的可定制性,是现代 AI 辅助软件开发的领先工…- 2
-
CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型
CogAgent-9B项目简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理,具备双语(中英文)交互能力,能预测并执行GUI操作,实现自动化任务。在多个GUI操作数据集上取得了领先成绩,模型已开源,推动大模型Agent生态的发展。CogAgent-9B可广泛应用于个人电脑、…- 1
-
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude
DeepSeek V3项目简介 DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞争对手。最新版DeepSeek-V3-0324 拥有6850亿参数,采用混合专家架构,融合多头潜在注意力和多标记预测技术,推理速度达每秒20个t…- 1
-
AgentScope – 阿里开源的多智能体开发平台
AgentScope项目简介 AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API和本地模型部署选项,覆盖聊天、图像合成、文本嵌入等多种任务。AgentScope包含拖拽式编程界面、交互式编程助手、实时监控功能,及丰富的开发资源,支持快速二次开发。AgentScope具备容错机制、…- 0
-
AI优质视频创作案例关于我用AI做了一部《三体》预告片
自从Runway画质和一致性更新以后,一直想再用AI做一部科幻的预告片。 所以,我就把手伸向了《三体》,话不多说,直接放视频吧。 《三体》的难度比之前的所有AI视频都要难,难点其实不是4s视频的处理。 而是电影质感的静态图。 三体的场景,大部分AI都画不出来。 Midjourney的电影质感很强,但是语义理解能力太差,很多镜头包括人体计算机、太阳系二向化等等根本画不出来。Stable Diffus…- 2
-
MobileLLM – Meta推出的适合移动端的语言模型
MobileLLM项目简介 MobileLLM是Meta为移动设备用例优化设计的十亿参数以下的大型语言模型,能解决云成本上升和延迟问题。MobileLLM基于深薄架构、嵌入共享和分组查询注意力机制等设计,实现在参数少于十亿的情况下获得高质量的语言模型。MobileLLM-125M/350M在零样本常识推理任务上相比先前的模型显著提升准确率,且MobileLLM家族在聊天基准测试中显示出对小型模型的…- 1
-
MEXMA – Meta推出的预训练跨语言句子编码器
MEXMA项目简介 MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中,MEXMA用一种语言的句子表示预测另一种语言中被遮蔽的词语,支持直接更新编码器中的句子表示和所有词语。MEXMA在多个任务上展现优越的性能,超越现有的预训练跨语言句子编码器,如LaBSE和SONAR。MEXMA支持80种语言,在句子分类等下游任务中表…- 4
-
WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型
WorldMem项目简介 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键问题。在WorldMem中,智能体在多样化场景中自由探索,生成的世界在视角和位置变化后能保持几何一致性。WorldMem 支持时间一致性建模,模拟动态变化(如物体对环境的影响)。模型在 Minecraft 数据…- 1