全部标签

工具测评

最新随机最多浏览最多喜欢

MotionCLR – AI动作编辑模型，根据文本提示生成相应的动作序列

MotionCLR项目简介 MotionCLR是基于注意力机制的人体动作生成和编辑模型，能根据文本提示生成动作，支持用户进行交互式编辑，如动作强调、减弱、替换、擦除和风格转移。MotionCLR基于自注意力和交叉注意力机制理解和编辑动作，支持多样化的动作编辑任务，如动作强调/减弱、原地动作替换、基于示例的动作生成等。模型在HumanML3D数据集上表现良好，生成的动作质量高，与文本描述的对齐精确，…
工具测评
- 4
7月10日
嫦娥、玉兔、圆月…要素集齐！分享中秋节海报AI设计思路实战案例附关键词

家人们呐，还有10天左右，就迎来今年的中秋节了!? 中秋国庆连续放假8天，想想都挺美!? 想必这时候，家人们已经开始考虑中秋的主题海报思路了。 AI元年，AI绘画会给我们带来很多意想不到的惊喜! 在此分享一组出品精美，以“嫦娥”和“玉兔”为画面主体的“咒语”?，直接套用关键词，可以非常快速地制作中秋节海报。嫦娥为主体玉兔与月饼为主题单纯以月饼为主题这一次生成没有垫图，用Midjourney…
工具测评
- 3
6月26日
OpenEMMA – 德克萨斯联合多伦多等大学开源的端到端自动驾驶多模态模型

OpenEMMA项目简介 OpenEMMA是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs）处理视觉数据和复杂驾驶场景的推理。框架基于链式思维推理过程，显著提高模型在轨迹规划和感知任务中的性能，同时集成专门优化的YOLO模型提高3D边界框预测的准确性。OpenEMMA提供了一个平台，促进更广泛的研究和开发，推动自动驾驶技术的进…
工具测评
- 2
7月21日
Make-It-Animatable – 中科大联合腾讯推出的自动生成即时动画准备资产

Make-It-Animatable项目简介 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架，能在不到一秒钟内让任何3D人形模型准备好进行角色动画状态，无论其形状和姿势如何。框架基于生成高质量的混合权重、骨骼和姿势变换，支持多种3D表示，包括网格和3D高斯斑点。基于从粗到细的表示和结构感知建模策略，确保准确性和鲁棒性，甚至适于具有非标准骨架结构的角…
工具测评
- 2
6月20日
DeepSite – 基于 DeepSeek 开源的 AI 前端开发工具

DeepSite项目简介 DeepSite 是基于 DeepSeek-V3 模型的在线开发工具，用户无需配置环境或安装软件，在网页上直接输入需求，快速生成游戏、应用或网页的代码，支持实时预览效果。DeepSite 支持多种任务，包括生成简单游戏（如贪吃蛇、打砖块）、特效（如烟花、代码雨）及功能型网页（如上传图片抠图、个人网站等）。DeepSite 开箱即用，为开发者和爱好者提供全新的快速开发体验。…
工具测评
- 2
6月11日
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架

SyncAnimation项目简介 SyncAnimation是实时端到端的音频驱动框架，用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情，包括嘴唇动作，实现高精度和高同步性的动画效果。框架基于NeRF技术，结合了音频到姿态和表情的同步模块，能从单目图像或噪声输入中生成具有丰富细节的头像动画。能在保持流畅动画的同时，生成逼真的面部细节和自然的动态变化。 Syn…
工具测评
- 2
7月18日
FastVLM – 苹果推出的高效视觉语言模型

FastVLM项目简介 FastVLM是苹果推出的高效的视觉语言模型（VLM），能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器，有效减少视觉token数量，显著降低编码时间。FastVLM在保持与现有VLM相似性能的同时，大幅提升处理速度，例如在LLaVA-1.5设置中，相比其他模型，将首次生成token的时间（TTFT）缩短3.2倍。FastVLM在多种VLM基…
工具测评
- 2
5月26日
AI优质视频创作案例AI数字人李小龙带你探索千年“龙之国”

甲辰龙年，时差岛邀约李小龙，为你讲述中国龙的史诗。龙是中国人几千年的想象，在现代社会离我们有点远了，但中国人一直自称龙的传人，因为龙融进我们的血脉，成了一种精气神!
工具测评
- 5
6月9日