-
Dolphin – 字节跳动开源的文档解析大模型
Dolphin项目简介 Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越GPT-4.1、Mistral-OCR等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解析,包括文本、表格、公式等。Dolphin的…- 1
-
KuaiFormer – 快手推出的检索框架,基于Transformer
KuaiFormer项目简介 KuaiFormer是快手技术团队推出的基于Transformer的检索框架,用在大规模内容推荐系统。基于重新定义检索流程,从传统的分数估计任务转变为Transformer驱动的“下一个动作预测”范式,有效进行实时兴趣获取和多兴趣提取,显著提升检索性能。KuaiFormer用多兴趣查询Token、自适应序列压缩机制,实现在亿级候选集上的稳定训练。已在2024 年 5 …- 1
-
Steamer-I2V – 百度推出的图像到视频生成模型
Steamer-I2V项目简介 Steamer-I2V 是百度 Steamer 团队推出的图像到视频生成模型,通过将静态图像转化为动态视频,展现出卓越的视觉生成能力。模型在 VBench 国际权威的视频生成评测中荣获榜首,基于精准的视觉控制、高清画质以及对中文语义的深刻理解脱颖而出。 Steamer-I2V 细粒度的视频结构化描述语言,能实现像素级的画面控制与电影级的构图效果,支持多模态输入,包括…- 1
-
MoneyPrinterTurbo – 开源的AI短视频生成工具
MoneyPrinterTurbo项目简介 MoneyPrinterTurbo是开源的AI短视频生成工具,能自动化地根据用户提供的视频主题或关键词生成视频文案、素材、字幕和背景音乐,合成高清短视频。工具支持API和Web界面操作,具备自定义文案、多种视频尺寸、批量视频生成、多语言支持、多种语音合成技术、字幕定制和背景音乐选择等功能。MoneyPrinterTurbo兼容多种AI模型,确保视频素材高…- 1
-
最新AI文本生成视频工具Pika全面测评:Runway最佳免费平替,30秒拥有会动的初恋小姐姐
AI视频生成工具:Pika AI 工具介绍:Pika是一款文本转视频的AI模型人工智能系统,支持将文本提示词输入,并生成视频作为输出。该模型分析文本,理解上下文,然后生成与输入文本中提供的描述一致的视觉元素和动作,作为创作者的原始视频素材提供剪辑。 工具链接:https://www.aieva.cn/sites/1255.html 现如今,AI唠嗑、AI绘画都不算啥稀罕事儿,打开B站、今日头条、百…- 1
-
AI优质视频创作案例AI数字人李小龙带你探索千年“龙之国”
甲辰龙年,时差岛邀约李小龙,为你讲述中国龙的史诗。龙是中国人几千年的想象,在现代社会离我们有点远了,但中国人一直自称龙的传人,因为龙融进我们的血脉,成了一种精气神!- 1
-
BILIVE – 开源AI录播工具,一站式自动直播录制与处理
BILIVE项目简介 BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标题和风格化的视频封面。BILIVE 能自动将处理后的视频投稿至 B 站,综合多种模态模型,兼容超低配置机器,无需 GPU 即可运行,适合个人用户和小型服务器使用。 BILIVE优势介绍 直播录制:自动录制B站直播,支持多…- 1
-
OPPO ColorOS 14把大模型装进手机,我们全面实测后发现:AI帮我打工更容易了
如今大模型进手机是真的火啊,各大手机厂商发布会都标配大模型,而且直接真刀真枪来现场演示。 喏,在OPPO ODC 2023大会上现场演示可以看到,ColorOS的一键识别屏幕文本,再进行智能摘要。 这谁看了不激动啊喂。于是我们也来赶紧实测体验了一把——它不仅提供各种AI生成能力,比如写大众点评的小作文: 还能长按图像闪速抠图。 而且整个系统都变得“更懂事儿&rd…- 1