全部标签

工具测评

最新随机最多浏览最多喜欢

LTX Video – Lightricks推出的开源AI视频生成模型

LTX Video项目简介 LTX Video是Lightricks推出的开源AI视频生成模型，能在4秒内生成5秒的高质量视频，速度超过观看速度。基于2亿参数的DiT架构，确保帧间平滑运动和结构一致性，解决了早期视频生成模型的关键限制。LTX Video支持长视频制作，提供灵活性和控制力，适用于多种场景，包括游戏图形升级和电子商务广告变体制作。 LTX Video优势介绍实时视频生成：LTX V…
工具测评
- 2
7月12日
App Intents – 苹果推出的集成Siri和Apple Intelligence新框架

App Intents项目简介 App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架，实现应用功能与系统体验（如Siri、Spotlight搜索、快捷指令）的无缝融合。App Intents基于定义应用意图、实体和选项，让用户能直接用Siri控制应用，搜索应用内容，创建自动化操作，提升应用的智能化和便捷性。 App In…
工具测评
- 0
7月12日
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架

RoboOS项目简介 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构，具身大脑RoboBrain负责全局感知与决策，小脑技能库负责低延迟精准执行，跨机器人数据中枢则实时共享空间、时间和本体记忆，形成感知-认知-决策-行动的闭环。 RoboOS支持松灵双臂、睿尔曼单/双臂、智元人形、宇树人形等不同类型的具身本体，实现大脑模型与小脑技能的“即插即用”，通过共享记…
工具测评
- 0
7月12日
FunClip – 阿里达摩院开源的AI自动视频剪辑工具

FunClip项目简介 FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化视频剪辑工具，通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别。用户可以根据识别结果，选择文本片段或特定说话人，快速裁剪出所需视频片段。FunClip的特色包括集成高精度的中文ASR模型、支持热词定制化、说话人识别，以及提供Gradio交互界面，使得视频剪辑…
工具测评
- 2
7月12日
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架

SANA 1.5项目简介 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器（Linear Diffusion Transformer），用于文本到图像生成任务。在 SANA 1.0 的基础上进行了改进，提出了三大创新点：高效的训练扩展，通过深度增长范式，将模型从 16 亿参数扩展到 48 亿参数，显著减少计算资源，结合了高效的 8 位优化器。模型深度剪枝，通过分析…
工具测评
- 1
7月12日
Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

Florence-VL项目简介 Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示，能捕捉图像的不同层次和方面的视觉特征，适应多样的下游任务。Florence-VL引进深度-广度融合（DBFusion）技术，将不同深度和多个提示下提取的视觉特征，实现视觉与语言理解的深度融合。…
工具测评
- 1
7月12日
西安沦陷，唯粉互撕，冥场面爆表AI数据化应用最强实战，用技术手段分析：TFBOYS灯牌大战谁赢了

TFBOYS的「十年之约」，想必家人们都有留意到吧? 上周日在西安的这场演唱会，全网刷屏的指数堪称年度爆表。万千粉丝期待已久的“三小只”「TFBOYS十周年」演唱会8月6日在西安如约上演，是三人时隔3年的全员合体。这支内娱的热门男子组合TFBOYS走到了第十年，貌合神离早已人尽皆知。三个人全场都不对视、不交谈、不微笑，隔着一米多远，你很难想像这竟然是一支男团组合，却硬是凑一块办了一场……割了…
工具测评
- 1
7月12日
AI绘画趣味案例生成与「龙」相关的成语，你画我猜：龙年的成语！你能猜对几个？

本视频是以AI绘画，生成图像，让你猜猜龙年以“龙”字出现的成语！在这个充满喜庆的2024年新春龙年，让我们一起用 AI 画图来猜猜龙年成语吧！你能猜对几个？快来挑战吧！看完之后，只能说，「群龙无首」，给我看麻了……
工具测评
- 0
7月12日