-
RoboBrain – 智源研究院开源的具身大脑模型
RoboBrain项目简介 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。RoboBrain采用多阶段训练策略,具备长历史帧记忆和高分辨率图像感知能力,能将抽象指令映射为具体动作。在任务规划、可操作区域感知和轨迹预测等评测任务中均表现出色。 RoboBra…- 1
-
Muse – 微软研究院推出的生成式AI模型
Muse项目简介 Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供…- 0
-
AI绘画撮合《芭比×海默》年度最奇葩CP:分享一组国外网友利用AI制作的电影宣发梗图
AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/404.html 家人们,最近好莱坞也太…- 1
-
OLMo 2 32B – Ai2 推出的最新开源语言模型
OLMo 2 32B项目简介 OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超越 GPT-3.5-Turbo 和 GPT-4o-mini 的完全开放模型,性能接近 Qwen-2.5-72B 等更大规模模型。 模型采用高效的训练策略,通过预训练、中训练和后训练…- 1
-
HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架
HippoRAG 2项目简介 HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化PageRank算法,将深度段落整合和更有效的在线LLM(大型语言模型)使用,推动RAG系统更接近人类长期记忆的效果。HippoRAG 2在离线阶段用LLM从段落中提取三元组并构建开放知识图谱(KG),同时…- 2
-
山海大模型 – 云知声推出的多模态AI大模型
山海大模型项目简介 山海大模型是云知声推出的多模态AI大模型,具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动,提供信息查询、知识学习、灵感激发等服务。山海大模型特点包括实时响应、情绪感知、音色切换和视觉场景理解,最新推出的山海多模态大模型,能实现实时的多模态交互,实时生成文本、音频和图像。 山海大模型优势介绍 内容生成与理解:能生成流畅的文本并理解…- 0
-
StyleShot – 开源的AI图像风格迁移模型
StyleShot项目简介 StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内容的整合。StyleShot 能捕捉从基本元素到复杂细节的多种风格特征,并支持文本和图像驱动的风格迁移。 StyleShot优势介绍 文本驱动风格迁移:用户可以提供文本描述和风格参考图像,StyleShot 将生成…- 4
-
想学打篮球吗?10秒get同款「AI图生图」:这种高级的AI艺术风景图,0基础小白也能做
远看是人??,近看是古典水墨的山海美景?️,看过的网友赐名——“周树人”。 GIF来源丨B站@地球HUB GIF来源丨B站@地球HUB GIF来源丨B站@地球HUB 分不清虚拟与现实的边界,AI在玩一种贼抽象的艺术? 最近,网上忽然涌现许多?「图藏图」的AI艺术特效图 这种高级的AI修图艺术,基于Stable Diffusion的ControlNet模型来实现画面控制,借住“垫图”,让图中的核心细…- 0