全部标签

工具测评

最新随机最多浏览最多喜欢

SWE-Kit – 构建自定义软件工程AI代理的开源框架

SWE-Kit项目简介 SWE-Kit 是Composio 推出的开源框架，简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具，用于构建自定义编码代理，支持与多种代理框架和大型语言模型集成，降低构建复杂 AI 代理的门槛。SWE-Kit 集成文件操作、代码分析、shell 命令执行等功能，提高开发效率、提供高度的可定制性，是现代 AI 辅助软件开发的领先工…
工具测评
- 2
7月7日
CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型

CogAgent-9B项目简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理，具备双语（中英文）交互能力，能预测并执行GUI操作，实现自动化任务。在多个GUI操作数据集上取得了领先成绩，模型已开源，推动大模型Agent生态的发展。CogAgent-9B可广泛应用于个人电脑、…
工具测评
- 1
7月7日
DeepSeek V3 – DeepSeek开源的最新版 AI 模型，编程能力超越Claude

DeepSeek V3项目简介 DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索（DeepSeek）开源的最新版AI模型，在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞争对手。最新版DeepSeek-V3-0324 拥有6850亿参数，采用混合专家架构，融合多头潜在注意力和多标记预测技术，推理速度达每秒20个t…
工具测评
- 1
7月7日
AgentScope – 阿里开源的多智能体开发平台

AgentScope项目简介 AgentScope是阿里巴巴集团开源的多智能体开发平台，帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持，内置多种模型API和本地模型部署选项，覆盖聊天、图像合成、文本嵌入等多种任务。AgentScope包含拖拽式编程界面、交互式编程助手、实时监控功能，及丰富的开发资源，支持快速二次开发。AgentScope具备容错机制、…
工具测评
- 0
7月7日
AI优质视频创作案例关于我用AI做了一部《三体》预告片

自从Runway画质和一致性更新以后，一直想再用AI做一部科幻的预告片。所以，我就把手伸向了《三体》，话不多说，直接放视频吧。《三体》的难度比之前的所有AI视频都要难，难点其实不是4s视频的处理。而是电影质感的静态图。三体的场景，大部分AI都画不出来。 Midjourney的电影质感很强，但是语义理解能力太差，很多镜头包括人体计算机、太阳系二向化等等根本画不出来。Stable Diffus…
工具测评
- 2
7月7日
MobileLLM – Meta推出的适合移动端的语言模型

MobileLLM项目简介 MobileLLM是Meta为移动设备用例优化设计的十亿参数以下的大型语言模型，能解决云成本上升和延迟问题。MobileLLM基于深薄架构、嵌入共享和分组查询注意力机制等设计，实现在参数少于十亿的情况下获得高质量的语言模型。MobileLLM-125M/350M在零样本常识推理任务上相比先前的模型显著提升准确率，且MobileLLM家族在聊天基准测试中显示出对小型模型的…
工具测评
- 1
7月7日
MEXMA – Meta推出的预训练跨语言句子编码器

MEXMA项目简介 MEXMA是由Meta AI推出的一种新型的预训练跨语言句子编码器。基于结合句子级和词语级的目标提升句子表示的质量。在训练过程中，MEXMA用一种语言的句子表示预测另一种语言中被遮蔽的词语，支持直接更新编码器中的句子表示和所有词语。MEXMA在多个任务上展现优越的性能，超越现有的预训练跨语言句子编码器，如LaBSE和SONAR。MEXMA支持80种语言，在句子分类等下游任务中表…
工具测评
- 4
7月7日
WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

WorldMem项目简介 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制，解决传统世界生成模型在长时序下缺乏一致性的关键问题。在WorldMem中，智能体在多样化场景中自由探索，生成的世界在视角和位置变化后能保持几何一致性。WorldMem 支持时间一致性建模，模拟动态变化（如物体对环境的影响）。模型在 Minecraft 数据…
工具测评
- 1
7月7日