-
AnimeGamer – 腾讯联合香港城市大学推出的动漫生活模拟系统
AnimeGamer项目简介 AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的身份沉浸于动态游戏世界中。玩家能操控如《悬崖上的金鱼姬》中的宗介等角色,与游戏世界互动。游戏支持生成具有上下文一致性的动态动画镜头(视频)及角色状态(如体力、社交和娱乐值)的更新。相比传统方法,AnimeGam…- 1
-
OmniEdit – 滑铁卢大学等机构开源的通用图像编辑模型
OmniEdit项目简介 OmniEdit是先进的图像编辑技术,通过结合多个专家模型的监督来训练一个通用模型,处理多种图像编辑任务。能处理不同纵横比的图像,七种不同的图像编辑任务,包括对象替换、移除、添加等,支持任意宽高比和分辨率。基于七个专家模型的监督训练确保任务覆盖,用在大型多模态模型评分提高训练数据质量,采用EditNet的新架构,提高了编辑的成功率。OmniEdit在自动评估和人工评估中均…- 2
-
AI绘画撮合《芭比×海默》年度最奇葩CP:分享一组国外网友利用AI制作的电影宣发梗图
AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/404.html 家人们,最近好莱坞也太…- 1
-
Make-It-Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产
Make-It-Animatable项目简介 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态,无论其形状和姿势如何。框架基于生成高质量的混合权重、骨骼和姿势变换,支持多种3D表示,包括网格和3D高斯斑点。基于从粗到细的表示和结构感知建模策略,确保准确性和鲁棒性,甚至适于具有非标准骨架结构的角…- 2
-
MCP – Anthropic 开源的模型上下文协议
MCP项目简介 MCP(Model Context Protocol,模型上下文协议)是一个开放协议,是Anthropic开源的,能实现大型语言模型(LLM)应用与外部数据源和工具之间的无缝集成。基于客户端-服务器架构,支持多个服务连接到任何兼容的客户端,提供标准化的、通用的协议共享资源、工具和提示。MCP能访问本地和远程资源,内置安全机制,保护API密钥不被泄露,是构建互联AI系统的重要工具。 …- 3
-
FlipSketch – 萨里大学推出的文本引导生成无约束草图动画的AI系统
FlipSketch项目简介 FlipSketch 是萨里大学推出的创新系统,能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现:微调草图风格的帧生成、用噪声细化保持输入草图视觉完整性的参考帧机制,及在不失去视觉一致性的情况下实现流畅运动的双注意力合成。与传统矢量动画不同,FlipSketch 支持动态草图变换,捕捉传统动画的自由表现力,让草图动画制作变得简单直观,同时保持手绘动画的艺…- 1
-
Infinity – 字节跳动推出的高分辨率图像生成模型
Infinity项目简介 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升图像生成的细节和质量,超越现有的顶级扩散模型,生成一张1024×1024的高质量图像仅需0.8秒,比SD3-Medium快2.6倍,且具有更快的推理速度。Infinity为自回归文本到图像生成模型设…- 2
-
PIKE-RAG – 微软亚洲研究院推出的检索增强型生成框架
PIKE-RAG项目简介 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Generation)是微软亚洲研究院推出的检索增强型生成框架,能解决传统RAG系统在复杂工业应用中的局限性。PIKE-RAG基于提取、理解和应用专业知识,构建连贯的推理逻辑,引导大型语言模型(LLM)生成准确的回答。PIKE-RAG引入知识原子化(Knowled…- 2