全部标签

工具测评

最新随机最多浏览最多喜欢

MHA2MLA – 复旦、上海AI Lab等推出优化LLM推理效率的方法

MHA2MLA项目简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法，基于引入DeepSeek的多头潜在注意力机制（MLA），优化任何基于Transformer的LLM的推理效率，降低推理成本。MHA2MLA基于两个关键策略实现：一是partial-RoPE，移除对注意力分数贡献较小的查询和键的旋转位置编码（RoPE）维度；二是低秩近似，基于联合奇异值…
工具测评
- 2
6月27日
Seaweed-7B – 字节推出的视频生成模型

Seaweed-7B项目简介 Seaweed-7B 是字节跳动团队推出的视频生成模型，拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容，支持多种分辨率和时长，广泛应用于视频创作、动画生成、实时交互等场景。Seaweed-7B设计注重成本效益，基于优化训练策略和架构，让中等规模模型在性能上与大型模型相媲美，降低计算成本。 Seawe…
工具测评
- 0
6月27日
FLUX Tools – 黑森林实验室推出的模型工具套组

FLUX Tools项目简介 FLUX Tools是黑森林实验室推出的一套模型工具，能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill（图像修复和扩展）、FLUX.1 Depth（基于深度图的结构引导）、FLUX.1 Canny（基于Canny边缘的结构引导）和FLUX.1 Redux（图像混合和重新创造）。工具基于提供文本描述和掩码，支持用户精…
工具测评
- 0
6月27日
StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架

StreamBridge项目简介 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型（Video-LLMs）框架，能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减压缩策略支持长上下文交互，引入轻量级激活模型实现主动响应功能。研究团队推出包含约 60 万个样本的 Stream-IT 数据集，提升流式视频理解能力。在主流离线模型如 LLaVA-OV-7B、Qwen…
工具测评
- 2
6月27日
AIGC应用于电影宣发素材实战美图分享：AI绘画撮合《芭比》×《封神》引来舒淇猛夸

创作者：@RUILYN CINEMAS AI绘画工具：Midjourney 工具介绍：Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式，让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术，让用户可以通过简单的文字提示，生成各种类型和风格的图像，从而实现视觉想象的无限可能。工具链接：https://www.aieva.cn/sites/…
工具测评
- 0
6月27日
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统

WorldCraft项目简介 WorldCraft是香港科技大学推出的基于大型语言模型（LLM）代理的3D世界创建和定制系统，用在创建和定制逼真的3D虚拟世界。基于自然语言交互，让用户能轻松生成复杂的室内外场景，对场景中的物体和布局进行精细调整。WorldCraft由三个核心模块组成：ForgeIt用在单个物体的定制，基于程序化生成实现精确的几何和纹理控制；ArrangeIt负责场景布局的生成，基…
工具测评
- 1
6月27日
嫦娥、玉兔、圆月…要素集齐！分享中秋节海报AI设计思路实战案例附关键词

家人们呐，还有10天左右，就迎来今年的中秋节了!? 中秋国庆连续放假8天，想想都挺美!? 想必这时候，家人们已经开始考虑中秋的主题海报思路了。 AI元年，AI绘画会给我们带来很多意想不到的惊喜! 在此分享一组出品精美，以“嫦娥”和“玉兔”为画面主体的“咒语”?，直接套用关键词，可以非常快速地制作中秋节海报。嫦娥为主体玉兔与月饼为主题单纯以月饼为主题这一次生成没有垫图，用Midjourney…
工具测评
- 3
6月26日
Agent TARS – 字节跳动开源的多模态 AI Agent 项目

Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容，与浏览器、命令行和文件系统无缝集成，实现复杂任务的规划与执行。Agent TARS 提供桌面客户端，展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力，成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段，仅支持 mac…
工具测评
- 4
6月26日