-
RoboBrain – 智源研究院开源的具身大脑模型
RoboBrain项目简介 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。RoboBrain采用多阶段训练策略,具备长历史帧记忆和高分辨率图像感知能力,能将抽象指令映射为具体动作。在任务规划、可操作区域感知和轨迹预测等评测任务中均表现出色。 RoboBra…- 0
-
GLM-Z1-Air – 智谱推出的深度思考模型
GLM-Z1-Air项目简介 GLM-Z1-Air 是智谱公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展现出强大的数理推理性能,与 DeepSeek-R1 等模型媲美。GLM-Z1-Air 在推理速度上相比 R1 提升 8 倍,成本降低至 1/30,支持在消费级显卡上运行,具有高性能与高性价比。GLM…- 0
-
难道面试官也要失业了?GPT4超真实模拟面试GPT4语音交互体验
视频介绍了一种使用AI模拟面试的新方法,通过ChatGPT可以替代面试官,帮助求职者练习和准备面试。 亮点 ChatGPT可以替代面试官,帮助求职者练习和准备面试 求职者可以通过ChatGPT回答面试问题,并获得反馈和评价 ChatGPT可以模拟不同类型的面试,包括人工智能领域的面试 视频作者展示了一个示范面试,让ChatGPT扮演面试官的角色 ChatGPT的未来发展可能不仅局限于替代老师,还可…- 3
-
钉钉新鲜上架AI版本“钉钉个人版”首发测评:全能办公效率神器,助你消除失业焦虑附邀请码
AI办公效率工具:钉钉个人版 工具介绍:钉钉个人版是钉钉推出的一款强大的个人生产力工具,您可以使用它生成您的个人知识库,搭建个人网站,管理各项工作流,存储管理您的海量资料,也可以随时发起会议与他人进行沟通协作。同时钉钉个人版也具备强大的AI 能力,可以随时为您解答各种问题,制定策划方案,创作图片视频,提供无穷灵感。 工具链接:https://workspace.dingtalk.com/welco…- 2
-
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构
UltraMem项目简介 UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 MoE 提升了2-6倍,成本最高可降低83%。UltraMem 的核心技术包括:多层结构改进,将大型内存层拆分为多个小内存层,分布在 Transformer 层中,增加 skip-layer 操作,…- 1
-
UNO – 字节跳动推出的创新AI图像生成框架
UNO项目简介 UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景下的一致性难题。UNO基于扩散变换器生成高一致性的多主体数据,采用渐进式跨模态对齐技术,分阶段训练模型,逐步提升生成效果。引入了通用旋转位置嵌入(UnoPE),支持多种分辨率和长宽比的图像生成。 UNO优势介绍 单主体定制生成:U…- 1
-
真的好丝滑!不再卡成PPT!实测:今天的AI视频发展速度远超预期
大概3个月前,我用AI绘画工具Stable Diffuison+AnimateDiff插件,制作的AI视频是如下动图的效果,跑爆了好几次电脑显存,花了2个小时。甚至在电脑主机旁边加了台风扇降温。最后得出的视频结果也只能是说“差强人意”(勉强能令人接受),可以认为基本等同于只是将几张相似的图像,合并在一起制作了一个GIF动图。 2个月前,随着AI视频技术的进步,我观察到的AI视频,质量已经有了巨大的…- 2
-
Seed-ASR – 字节跳动推出的AI语音识别模型
Seed-ASR项目简介 Seed-ASR是字节跳动推出的一款基于大型语言模型(LLM)的语音识别(ASR)模型。在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练,支持普通话和13种中国方言的转录,能识别英语和其他7种外语的语音。Seed-ASR采用自监督学习、监督微调、上下文感知训练和强化学习等技术,提高了识别精度和上下文理解能力。在视频、直播和会议等,在多人交谈或背景噪音中也…- 2