-
MHA2MLA – 复旦、上海AI Lab等推出优化LLM推理效率的方法
MHA2MLA项目简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜在注意力机制(MLA),优化任何基于Transformer的LLM的推理效率,降低推理成本。MHA2MLA基于两个关键策略实现:一是partial-RoPE,移除对注意力分数贡献较小的查询和键的旋转位置编码(RoPE)维度;二是低秩近似,基于联合奇异值…- 2
-
Seaweed-7B – 字节推出的视频生成模型
Seaweed-7B项目简介 Seaweed-7B 是字节跳动团队推出的视频生成模型,拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容,支持多种分辨率和时长,广泛应用于视频创作、动画生成、实时交互等场景。Seaweed-7B设计注重成本效益,基于优化训练策略和架构,让中等规模模型在性能上与大型模型相媲美,降低计算成本。 Seawe…- 0
-
FLUX Tools – 黑森林实验室推出的模型工具套组
FLUX Tools项目简介 FLUX Tools是黑森林实验室推出的一套模型工具,能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill(图像修复和扩展)、FLUX.1 Depth(基于深度图的结构引导)、FLUX.1 Canny(基于Canny边缘的结构引导)和FLUX.1 Redux(图像混合和重新创造)。工具基于提供文本描述和掩码,支持用户精…- 0
-
StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
StreamBridge项目简介 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(Video-LLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减压缩策略支持长上下文交互,引入轻量级激活模型实现主动响应功能。研究团队推出包含约 60 万个样本的 Stream-IT 数据集,提升流式视频理解能力。在主流离线模型如 LLaVA-OV-7B、Qwen…- 2
-
AIGC应用于电影宣发素材实战美图分享:AI绘画撮合《芭比》×《封神》引来舒淇猛夸
创作者:@RUILYN CINEMAS AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/…- 0
-
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统
WorldCraft项目简介 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布局进行精细调整。WorldCraft由三个核心模块组成:ForgeIt用在单个物体的定制,基于程序化生成实现精确的几何和纹理控制;ArrangeIt负责场景布局的生成,基…- 1
-
嫦娥、玉兔、圆月…要素集齐!分享中秋节海报AI设计思路实战案例附关键词
家人们呐,还有10天左右,就迎来今年的中秋节了!? 中秋国庆连续放假8天,想想都挺美!? 想必这时候,家人们已经开始考虑中秋的主题海报思路了。 AI元年,AI绘画会给我们带来很多意想不到的惊喜! 在此分享一组出品精美,以“嫦娥”和“玉兔”为画面主体的“咒语”?,直接套用关键词,可以非常快速地制作中秋节海报。 嫦娥为主体 玉兔与月饼为主题 单纯以月饼为主题 这一次生成没有垫图,用Midjourney…- 3
-
Agent TARS – 字节跳动开源的多模态 AI Agent 项目
Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力,成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段,仅支持 mac…- 4