-
AI绘画之战逐渐白热化,实测OpenAI最新推出的AI绘画工具DALL-E 3
AI绘画之战,逐步走向逐渐白热化… 说起AI绘画我可就不困了,大家比较熟悉的AI绘画门派主要是Stable Diffsion和Midjourney。但要回溯AI绘画发展历程中,OpenAI(开发出ChatGPT的那家公司),才是它们俩的大师兄,毕竟OpenAI推出的DALL-E,才是首先采用最新扩散生成技术的AI绘画工具。 然而,OpenAI虽然公司的名字里边带有“Ope…- 1
-
Versatile-OCR-Program – 开源多模态OCR工具,精准提取复杂结构化数据
Versatile-OCR-Program项目简介 Versatile-OCR-Program是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习训练的高质量数据集。Versatile-OCR-Program基于DocLayout-YOLO、Google Vision和MathPix等技术,精准识别文本、数学公式、表格、图表等多模态内容,支持日语、韩语、英语等多种语言。工…- 1
-
MHA2MLA – 复旦、上海AI Lab等推出优化LLM推理效率的方法
MHA2MLA项目简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜在注意力机制(MLA),优化任何基于Transformer的LLM的推理效率,降低推理成本。MHA2MLA基于两个关键策略实现:一是partial-RoPE,移除对注意力分数贡献较小的查询和键的旋转位置编码(RoPE)维度;二是低秩近似,基于联合奇异值…- 2
-
Seaweed-7B – 字节推出的视频生成模型
Seaweed-7B项目简介 Seaweed-7B 是字节跳动团队推出的视频生成模型,拥有约 70 亿参数。Seaweed-7B具备强大的视频生成能力。模型支持从文本描述、图像或音频生成高质量的视频内容,支持多种分辨率和时长,广泛应用于视频创作、动画生成、实时交互等场景。Seaweed-7B设计注重成本效益,基于优化训练策略和架构,让中等规模模型在性能上与大型模型相媲美,降低计算成本。 Seawe…- 0
-
FLUX Tools – 黑森林实验室推出的模型工具套组
FLUX Tools项目简介 FLUX Tools是黑森林实验室推出的一套模型工具,能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill(图像修复和扩展)、FLUX.1 Depth(基于深度图的结构引导)、FLUX.1 Canny(基于Canny边缘的结构引导)和FLUX.1 Redux(图像混合和重新创造)。工具基于提供文本描述和掩码,支持用户精…- 0
-
StreamBridge – 苹果联合复旦推出的端侧视频大语言模型框架
StreamBridge项目简介 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(Video-LLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减压缩策略支持长上下文交互,引入轻量级激活模型实现主动响应功能。研究团队推出包含约 60 万个样本的 Stream-IT 数据集,提升流式视频理解能力。在主流离线模型如 LLaVA-OV-7B、Qwen…- 2
-
AIGC应用于电影宣发素材实战美图分享:AI绘画撮合《芭比》×《封神》引来舒淇猛夸
创作者:@RUILYN CINEMAS AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/…- 0
-
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统
WorldCraft项目简介 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室内外场景,对场景中的物体和布局进行精细调整。WorldCraft由三个核心模块组成:ForgeIt用在单个物体的定制,基于程序化生成实现精确的几何和纹理控制;ArrangeIt负责场景布局的生成,基…- 1