-
Step-1o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型
Step-1o Audio项目简介 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出贴心回应。如,在用户分享喜悦时,能恰如其分地提问;在用户感到疲惫时,能提供安慰和建议。Step-1o Audio 支持多语种和方言理解,能用四川话等方言自然交流,精准把握语调和词汇。具备个性化风格表达,可根据场景调整语气。 …- 4
-
Omni Reference – Midjourney V7推出的图像参考功能
Omni Reference项目简介 Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Midjourney V7 版本,支持个性化、风格化和情绪板等功能。Omni Reference 支持基于 Web 端拖拽图像或在 Discord 中使用 --oref 命令实现,基于-…- 1
-
Lumina-Image 2.0 – 上海 AI Lab 开源的统一图像生成模型
Lumina-Image 2.0项目简介 Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在文本对齐能力上达到行业领先水平,能根据文本描述生成高质量、多风格的图像。模型支持多种推理求解器,如中点求解器、欧拉求解器和DPM求解器,生成速度较快。 Lumina-Image 2.…- 3
-
引爆热议!AIGC应用于医疗诊断实战:美国男孩怪病缠身3年求医数十人无果,最终被ChatGPT成功诊断
AI奇点网9月18日报道丨小编最近了解到了一件很匪夷所思但是又很令人深思的事件。这是发生在一名美国4岁小男孩Alex身上的真实经历。AI奇点网从外媒获悉,2020年,Alex在某次运动后,他身体开始剧痛。母亲前后带她看了17名医生,从儿科、骨科到各种专家,先后进行了MRI等一系列检查,但没一个真正找出病因。 今年,Alex的母亲起初没有抱太大的希望,她开始尝试求助于ChatGPT的对话聊天机器人,…- 3
-
NanoFlow – 优化大语言模型推理吞吐量的服务框架
NanoFlow项目简介 NanoFlow 是一个高性能的服务框架,专为大型语言模型(LLMs)设计,以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源,优化了模型的推理过程。并行处理机制使得 NanoFlow 能同时处理更多的请求,并且保证快速响应,从而显著提升了系统的整体性能和用户体验。 NanoFlow优势介绍 提高推理吞吐量:NanoFlow 的核心目标是最大化模型的…- 3
-
Helix – Figure 推出的端到端通用控制模型
Helix项目简介 Helix 是 Figure 推出的通用视觉-语言-动作(VLA)模型,用于人形机器人的控制。Helix首创性地实现对机器人整个上身(包括手腕、躯干、头部和手指)的高速率(200Hz)连续控制,支持多机器人协作,多个机器人共用同一组神经网络权重完成任务。Helix 基于自然语言指令拿起从未见过的物品,表现出强大的泛化能力。Helix 的训练完全端到端,无需任务特定的微调,在低功…- 4
-
Cline – AI编程助手,集成于 VSCode 实时检查语法错误
Cline项目简介 Cline 是集成于 VSCode 的 AI 编程助手,通过智能化手段提升开发效率。具备强大的代码生成与编辑能力,能根据用户需求快速创建或修改代码文件,实时检查语法错误。Cline 支持在终端执行命令,帮助开发者完成诸如安装依赖、运行脚本等操作。 对于 Web 开发,Cline 可以通过无头浏览器启动网站,进行交互操作并捕获日志,助力调试和优化。支持多语言模型,根据需求选择免费…- 5
-
豆包PixelDance – 字节跳动推出的AI视频生成大模型,基于DiT结构
豆包PixelDance项目简介 豆包PixelDance是字节跳动最新推出的AI视频生成模型,采用DiT结构,支持文生视频和图生视频。它能理解复杂指令,生成长达10秒的连贯视频片段,涵盖多主体交互和时序性动作。豆包PixelDance模型具备卓越的语义理解力和丰富的运镜效果,能一键生成具有故事性的多镜头短片。豆包PixelDance支持多种风格和视频比例,适用于影视、广告、短视频等多种场景,极大…- 2