-
MiniMates – 轻量级AI数字人项目,支持语音和表情两种驱动模式
MiniMates项目简介 MiniMates是高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,能在普通电脑上实现实时运行。基于先进的技术架构,提供极致的速度体验和个性化定制功能,支持用户根据需求定制AI伙伴。MiniMates拥有卓越的性能和灵活性,为用户提供强大的数字人驱动解决方案,适用于多种应用场景。 MiniMates优势介绍 语音驱动:支持数字人根据语音指令进行相应的动作和表情…- 0
-
ChatGPT、阿里通义等AI机器人参加今年高考出分:干翻90%考生,有一科全员不及格
6月19日,上海人工智能实验室和司南评测体系发布了国内首个针对AI大模型参与2024高考「语数英」三科目的全卷解题能力测试的结果。 本次测试,选取了6款开源大模型以及公认的「地表最强」GPT-4o进行,考卷选择了「全国新课标I卷」。参与评测的所有开源模型,开源时间均早于今年的高考,成绩均由拥有高考评卷经验的老师进行人工阅卷评判。 让我们先看下都有哪些选手: GPT-4o:OpenAI在5月最新发布…- 4
-
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架
RoboOS项目简介 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,跨机器人数据中枢则实时共享空间、时间和本体记忆,形成感知-认知-决策-行动的闭环。 RoboOS支持松灵双臂、睿尔曼单/双臂、智元人形、宇树人形等不同类型的具身本体,实现大脑模型与小脑技能的“即插即用”,通过共享记…- 0
-
Dream-7B – 港大联合华为诺亚方舟开源的扩散推理模型
Dream-7B项目简介 Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。Dream-7B在通用、数学、编程等任务上表现优异,与同尺寸的自回归模型(Qwen2.5 7B、LLaMA3 8B)性能相媲美,在某些情况下优于最新的 Deepseek V3 6…- 0
-
Kimi连夜上线PPT生成功能测评18款AIPPT产品
昨天,Kimi毫无预兆的发了一个公告。 然后我就被刷屏了。 PPT这玩意,确实比什么AI绘图、AI视频什么的,都要刚需。 是无论是社畜还是大学牲,都逃不开的东西。 而制作一份优秀的PPT,真的不容易。构思、排版、设计...每一步都需要投入大量时间和精力。 记得我之前去演讲,一个PPT,要做十几天。。。 但是对于很多普通人来说,PPT其实就是个交差的玩意。 在我心中PPT有两种,一种是演讲型PPT,…- 1
-
Omni Reference – Midjourney V7推出的图像参考功能
Omni Reference项目简介 Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Midjourney V7 版本,支持个性化、风格化和情绪板等功能。Omni Reference 支持基于 Web 端拖拽图像或在 Discord 中使用 --oref 命令实现,基于-…- 1
-
ORMBG – 开源的AI图像分割工具
ORMBG项目简介 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑、图像合成和自动化图像处理等领域。ORMBG是一个社区驱动的项目,鼓励全球开发者参与,贡献代码,共同推动项目的发展和完善。 ORMBG优势介绍 照片编辑:快速去除人物或物体背景,便于…- 0
-
Seed-Music – 字节跳动推出的AI音乐生成大模型
Seed-Music项目简介 Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法,根据用户的多模态输入(如风格描述、音频参考、乐谱和声音提示)生成高质量、风格可控的音乐。Seed-Music旨在简化音乐创作流程,让无论是新手还是专业音乐人都能轻松创作音乐。不仅能生成完整的音频作品,还提供音乐编辑功能,用户可以对生成的…- 1