-
阿里开源ThinkSound:AI自动为视频加音效,影视与游戏创作迎来大变革!
2025年7月,阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound,为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入,生成高保真的音效与音景,完美适配画面内容,为影视制作、游戏开发及多媒体创作注入全新活力。AIbase结合最新信息,深入剖析ThinkSound的独特优势与行业影响,带您一探AI音效生成的新前沿。 ThinkSound:AI“音效师”惊艳亮…- 1
- 0
-
PixVerse国内版“拍我AI”正式发布,解锁AI视频创作新玩法
备受海外市场追捧的AI视频生成平台PixVerse正式推出其国内版本 “拍我AI”,并同步上线移动端App和网页版。这一产品的发布标志着PixVerse正式进军中国市场,为国内内容创作者和企业提供了高效、便捷的AI视频生成工具。AIbase深入解析“拍我AI”的核心功能与市场潜力,带您一探这一席卷全球的AI视频平台的国内新篇章。 网页端:https://pai.video App端:https:/…- 2
- 0
-
Claude即将大升级!百万字符上下文+记忆功能,AI交互要逆天了!
近日,关于 Anthropic 旗下 AI 模型 Claude 的功能改进建议引发广泛关注。这些建议涵盖了上下文窗口扩展、记忆功能增强、文件格式支持扩展等多个方面,预示着 Claude 可能迎来重大升级。AIbase 综合整理最新信息,为您深入解析 Claude 未来发展的潜力与方向。 百万字符上下文:突破长文本处理瓶颈 建议提出将 Claude 的上下文窗口扩展至100万字符(约1M Token…- 2
- 0
-
MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制,影视游戏行业要变天
AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视频生成带来了前所未有的灵活性和精确性。AIbase为您整理了MotionPro的最新进展及其对行业的深远影响。 创新技术:区域轨迹与运动掩码的突破 传统图像到视频生成技术通常依赖大尺度高斯核来扩展运动轨迹…- 1
- 0
-
TEN Agent开源TEN VAD与Turn Detection,助力语音AI超低延迟
TEN Agent团队近日宣布,其核心模型**TEN Voice Activity Detection (VAD)**和**TEN Turn Detection**正式开源,为构建实时、多模态的语音AI代理提供了强大的技术支持。 这一举措标志着TEN框架在推动语音交互技术民主化与开源协作方面的重大进展。以下是AIbase整理的最新资讯,深入解析这两大核心模型的功能、优势及对行业的潜在影响。 TEN…- 2
- 0
-
Moonvalley发布Marey Realism v1.5:原生1080P AI视频模型,零版权风险引领行业新风向!
随着人工智能技术的飞速发展,AI视频生成领域再迎重磅突破。近日,Moonvalley正式发布其全新AI视频生成模型 Marey Realism v1.5,并通过ComfyUI平台实现全面集成。这款模型以其原生1080P高清晰度、100%基于授权内容的训练数据以及强大的创作功能,迅速引发行业热议。 原生1080P,视觉品质再升级 Marey Realism v1.5最大的亮点之一是其原生1080P…- 4
- 0
-
OpenAI放大招!图像生成API升级:实时流式预览+多轮编辑,MCP加持让创作无界限!
OpenAI宣布其图像生成API(Responses API)迎来重大更新,新增流式传输、多轮编辑以及与Model Context Protocol(MCP)工具和实时网络数据搜索的集成功能。这些新特性不仅提升了图像生成效率,还为开发者提供了更灵活的创作方式,标志着AI驱动的视觉内容创作进入全新阶段。AIbase为您整理了此次更新的核心亮点及其对行业的深远影响。 流式传输:实时预览,创作更高效 O…- 2
- 0
-
Sam Altman预测:2026 AI发现新知,2027机器人崛起,2030智能无限!
近日,OpenAI首席执行官Sam Altman发表最新博客文章,预测AI技术已跨越关键临界点,未来几年将迎来重大突破。从2026年发现新颖见解的AI系统,到2027年能在现实世界执行任务的机器人,再到2030年代智能与能量的极大丰富,Altman的展望引发了全球热议。AIbase编辑团队整理了最新信息,为您深度解析这一AI未来蓝图及其对全球的影响。 AI技术临界点:趋势不可逆转 Sam Altm…- 1
- 0
-
xAI控制台新增Grok4及Grok4Code引用,标志着下一代AI模型即将发布
—xAI公司在其开发者控制台中新增了对Grok4及Grok4Code的引用,预示着其下一代人工智能模型的发布即将来临。这一消息引发了业界对Grok4系列功能的广泛关注,标志着xAI在通用人工智能及开发者工具领域的又一重大进展。 根据AIbase的报道,xAI控制台的更新显示,Grok4将是xAI的旗舰模型,专注于自然语言处理、数学推理和综合推理能力的提升,被描述为“全能型AI的巅峰之作”。与此同时…- 0
- 0
-
宇树科技创始人王兴兴:从单枪匹马到年营收十亿的机器人巨头
6月26日 ,在今日举行的天津夏季达沃斯论坛现场,宇树科技首席执行官王兴兴向与会者分享了公司令人瞩目的成长历程。据AIbase报道,王兴兴透露,宇树科技自2016年创立之初的“一人公司”,如今已发展成为拥有近千名员工、年营收突破十亿元人民币的行业巨头。 王兴兴的发言揭示了宇树科技在短短九年间所取得的巨大飞跃,展现了其在机器人领域的强劲实力和市场影响力。- 0
- 0
-
高考志愿填报带热夸克“深度搜索”,每位考生平均使用4次
随着31省市高考分数线公布,志愿填报需求全面爆发。6月26日,AIbase从夸克方面获悉,过去三天,已经有上千万考生和家长使用了夸克高考的各项服务,其中由高考志愿大模型生成的志愿报告超500万份,近一半需求来自于三线及以下城市。 6月25日是系统压力最大的一天。因多个高考大省密集出分,考生集中涌入,导致志愿报告排队人数一度过万。在夸克扩容算力资源后,排队情况得到缓解。仅一天便生成报告超过250万份…- 2
- 0
-
特斯拉Robotaxi无人出租车正式测试:全自动驾驶迈向新里程碑!
Tesla在德克萨斯州奥斯汀启动了Robotaxi无人出租车的公开测试,标志着其全自动驾驶(FSD)Unsupervised模式的重大突破。此次测试中,车辆驾驶座完全空置,运行全程由AI系统自主控制,仅在副驾驶位置配备一名安全监控员,且无方向盘或踏板控制权限。 全自动驾驶新篇章:FSD Unsupervised模式亮相 Tesla Robotaxi测试采用FSD Unsupervised(无监督全…- 0
- 0
-
Grok接管推特算法!小号也能爆红,新人起号迎来黄金时代?
据最新消息,xAI开发的Grok人工智能正式接管了X的推荐算法,这一变化不仅将重塑用户的内容体验,还为粉丝较少的小号用户和新人带来了前所未有的机遇。以下是AIbase为您整理的最新资讯,带您深入了解这一变革的细节及其潜在影响。 Grok驱动推荐算法:小号内容获优先推荐 Grok作为xAI旗下的核心AI产品,此次被深度整合进X平台的推荐系统,旨在优化内容分发的精准性和公平性。新算法将更加注重内容的质…- 0
- 0
-
OpenAI因商标战下架Jony Ive合作!AI硬件梦想能否照进现实?
OpenAI因商标纠纷问题,从其官方网站的合作伙伴页面中悄然删除了与前苹果设计大师Jony Ive的合作信息,包括相关宣传视频和博客内容。此举源于一家名为Iyo的初创公司提起的商标诉讼,涉及OpenAI在与Jony Ive合作中使用的“io”品牌名称。尽管如此,OpenAI与Jony Ive的合作项目仍在推进,引发业界对AI硬件未来发展的广泛关注。 商标争议始末:Iyo指控“io”品牌侵权 据公开…- 0
- 0
-
Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程
近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。以下…- 2
- 0
-
OpenAI宣布ChatGPT推出MCP支持与会议记录功能
OpenAI宣布,ChatGPT迎来两项重大功能更新:支持Model Context Protocol (MCP)以及新增会议记录模式,为企业和团队提供更高效的智能协作体验。这两大功能的推出,标志着ChatGPT在企业级应用领域的进一步深化,旨在通过深度整合内部数据与自动化会议管理,提升工作效率与数据利用率。以下为AIbase整理的最新动态与功能解析。 MCP支持:无缝连接企业内部数据 ChatG…- 0
- 0
-
AI奇迹!失声歌手用Suno掩护工具重现完美嗓音,音乐梦想触手可及!
近日,一位因神经性失声而面临声音障碍的歌手,通过Suno AI的“掩护”(Cover)工具,成功将受损的录音转化为清晰、强劲的声乐表演,完美呈现其创作愿景。这一案例不仅展示了AI在音乐领域的突破性应用,也为身体障碍者重返艺术舞台提供了全新可能。AIbase综合最新网络信息,为您深入解析这一感人故事与技术背后的奥秘。 图源备注:图片由AI生成,图片授权服务商Midjourney AI赋能失声歌手:从…- 5
- 0
-
Jaaz开源AI设计Agent横空出世!一键批量生成图像,创意生产从此起飞!
人工智能正在重塑创意设计领域,一款全新的开源工具Jaaz引发了广泛关注。AIbase从社交媒体平台获取最新信息,了解到Jaaz是一款开源AI设计Agent,支持通过简单的API配置实现自动化批量图像生成,为专业创作者和团队提供了高效的解决方案。本文将详细解析Jaaz的功能亮点、当前局限性以及其对AI创意产业的潜在影响。 Jaaz:开源AI设计Agent的突破 Jaaz是一款专为图像生成设计的开源A…- 0
- 0