-
LTX Video – Lightricks推出的开源AI视频生成模型
LTX Video项目简介 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基于2亿参数的DiT架构,确保帧间平滑运动和结构一致性,解决了早期视频生成模型的关键限制。LTX Video支持长视频制作,提供灵活性和控制力,适用于多种场景,包括游戏图形升级和电子商务广告变体制作。 LTX Video优势介绍 实时视频生成:LTX V…- 2
-
App Intents – 苹果推出的集成Siri和Apple Intelligence新框架
App Intents项目简介 App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架,实现应用功能与系统体验(如Siri、Spotlight搜索、快捷指令)的无缝融合。App Intents基于定义应用意图、实体和选项,让用户能直接用Siri控制应用,搜索应用内容,创建自动化操作,提升应用的智能化和便捷性。 App In…- 0
-
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架
RoboOS项目简介 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,跨机器人数据中枢则实时共享空间、时间和本体记忆,形成感知-认知-决策-行动的闭环。 RoboOS支持松灵双臂、睿尔曼单/双臂、智元人形、宇树人形等不同类型的具身本体,实现大脑模型与小脑技能的“即插即用”,通过共享记…- 0
-
FunClip – 阿里达摩院开源的AI自动视频剪辑工具
FunClip项目简介 FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别。用户可以根据识别结果,选择文本片段或特定说话人,快速裁剪出所需视频片段。FunClip的特色包括集成高精度的中文ASR模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,使得视频剪辑…- 2
-
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架
SANA 1.5项目简介 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用于文本到图像生成任务。在 SANA 1.0 的基础上进行了改进,提出了三大创新点:高效的训练扩展,通过深度增长范式,将模型从 16 亿参数扩展到 48 亿参数,显著减少计算资源,结合了高效的 8 位优化器。模型深度剪枝,通过分析…- 1
-
Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型
Florence-VL项目简介 Florence-VL是创新的多模态大型语言模型(MLLMs),是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示,能捕捉图像的不同层次和方面的视觉特征,适应多样的下游任务。Florence-VL引进深度-广度融合(DBFusion)技术,将不同深度和多个提示下提取的视觉特征,实现视觉与语言理解的深度融合。…- 1
-
西安沦陷,唯粉互撕,冥场面爆表AI数据化应用最强实战,用技术手段分析:TFBOYS灯牌大战谁赢了
TFBOYS的「十年之约」,想必家人们都有留意到吧? 上周日在西安的这场演唱会,全网刷屏的指数堪称年度爆表。 万千粉丝期待已久的“三小只”「TFBOYS十周年」演唱会8月6日在西安如约上演,是三人时隔3年的全员合体。 这支内娱的热门男子组合TFBOYS走到了第十年,貌合神离早已人尽皆知。 三个人全场都不对视、不交谈、不微笑,隔着一米多远,你很难想像这竟然是一支男团组合,却硬是凑一块办了一场……割了…- 1
-
AI绘画趣味案例生成与「龙」相关的成语,你画我猜:龙年的成语!你能猜对几个?
本视频是以AI绘画,生成图像,让你猜猜龙年以“龙”字出现的成语! 在这个充满喜庆的2024年新春龙年,让我们一起用 AI 画图来猜猜龙年成语吧! 你能猜对几个?快来挑战吧! 看完之后,只能说,「群龙无首」,给我看麻了……- 0