-
AI优质短片创作案例用王家卫的方式,回顾“平凡”的2023年
作者平凡的生活回顾了2023年发生的种种事情,包括城市变化、个人经历、科技发展等。 00:092023年城市生活:描述了作者在2023年观察到的城市生活场景和自己的感受。 01:10普通人的触动: 讲述了一个普通人在2023年遇到的一些让人触动的事情。 02:27人们的选择:探讨了人们在2023年面临的选择和挑战,以及作者自己的看法。- 1
-
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型
Embodied Reasoner项目简介 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索、推理和行动协同完成复杂任务。模型基于模仿学习、自我探索和自我修正的三阶段训练方法,生成多样化的思考过程(如情境分析、空间推理、自我反思等),基于交互历史和空间布局进行高效规划和推理。在AI2-THOR模拟器的多种任务中,Emb…- 1
-
Granite 3.0 – IBM推出用于企业级应用的系列AI模型
Granite 3.0项目简介 Granite 3.0 是 IBM 推出的一系列先进的AI模型,能在多个学术和企业基准测试中展现出卓越的性能。模型设计用在企业级应用,能执行各种任务,包括文本生成、分类、问答等,特别擅长检索增强生成和多语言对话。Granite 3.0 包括通用语言模型、安全防护模型和专家混合模型,支持低延迟推理,适于在各种设备上部署。Granite 3.0 模型的发布,提升 AI …- 1
-
SkyReels-V1 – 昆仑万维开源首个面向AI短剧创作的视频生成模型
SkyReels-V1项目简介 SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型。基于在千万级高质量影视数据上进行微调,实现影视级的人物微表情和肢体动作生成,支持33种细腻表情与400多种自然动作组合,高度还原真实情感表达。模型支持文生视频(Text-to-Video),图生视频(Image-to-Video),在开源视频生成模型中达到SOTA水平。SkyReels-V1基…- 0
-
Seed-Music – 字节跳动推出的AI音乐生成大模型
Seed-Music项目简介 Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法,根据用户的多模态输入(如风格描述、音频参考、乐谱和声音提示)生成高质量、风格可控的音乐。Seed-Music旨在简化音乐创作流程,让无论是新手还是专业音乐人都能轻松创作音乐。不仅能生成完整的音频作品,还提供音乐编辑功能,用户可以对生成的…- 1
-
OPPO ColorOS 14把大模型装进手机,我们全面实测后发现:AI帮我打工更容易了
如今大模型进手机是真的火啊,各大手机厂商发布会都标配大模型,而且直接真刀真枪来现场演示。 喏,在OPPO ODC 2023大会上现场演示可以看到,ColorOS的一键识别屏幕文本,再进行智能摘要。 这谁看了不激动啊喂。于是我们也来赶紧实测体验了一把——它不仅提供各种AI生成能力,比如写大众点评的小作文: 还能长按图像闪速抠图。 而且整个系统都变得“更懂事儿&rd…- 3
-
RMBG-2.0 – 开源的图像背景移除模型,支持各类图像高精度背景移除
RMBG-2.0项目简介 RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA(State of the Art,即当前最佳)水平。RMBG-2.0在性能上超越前代版本,从1.4版本的73.26%准确率大幅提升至2.0版本的90.14%,超越业界知名的付费工具remove.bg。RMBG-2.0在超过15,000张高分辨率图像上…- 0
-
GPT Pilot – AI编程工具,让95%的开发者实现自动写代码
GPT Pilot项目简介 GPT Pilot 是一款AI编程工具,通过模仿人类开发者的工作流程,帮助从零开始构建应用程序。能编写代码、调试程序、与用户讨论问题,并请求代码审查,是真正的 AI 开发者伙伴。GPT Pilot 支持多种运行方式,包括 VS Code 扩展、命令行工具和 Docker 容器,开发者能在熟悉的环境里提升开发效率。 GPT Pilot优势介绍 全功能代码生成:能编写大部分…- 1