-
Lumina-Image 2.0 – 上海 AI Lab 开源的统一图像生成模型
Lumina-Image 2.0项目简介 Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在文本对齐能力上达到行业领先水平,能根据文本描述生成高质量、多风格的图像。模型支持多种推理求解器,如中点求解器、欧拉求解器和DPM求解器,生成速度较快。 Lumina-Image 2.…- 3
-
引爆热议!AIGC应用于医疗诊断实战:美国男孩怪病缠身3年求医数十人无果,最终被ChatGPT成功诊断
AI奇点网9月18日报道丨小编最近了解到了一件很匪夷所思但是又很令人深思的事件。这是发生在一名美国4岁小男孩Alex身上的真实经历。AI奇点网从外媒获悉,2020年,Alex在某次运动后,他身体开始剧痛。母亲前后带她看了17名医生,从儿科、骨科到各种专家,先后进行了MRI等一系列检查,但没一个真正找出病因。 今年,Alex的母亲起初没有抱太大的希望,她开始尝试求助于ChatGPT的对话聊天机器人,…- 3
-
NanoFlow – 优化大语言模型推理吞吐量的服务框架
NanoFlow项目简介 NanoFlow 是一个高性能的服务框架,专为大型语言模型(LLMs)设计,以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源,优化了模型的推理过程。并行处理机制使得 NanoFlow 能同时处理更多的请求,并且保证快速响应,从而显著提升了系统的整体性能和用户体验。 NanoFlow优势介绍 提高推理吞吐量:NanoFlow 的核心目标是最大化模型的…- 3
-
Helix – Figure 推出的端到端通用控制模型
Helix项目简介 Helix 是 Figure 推出的通用视觉-语言-动作(VLA)模型,用于人形机器人的控制。Helix首创性地实现对机器人整个上身(包括手腕、躯干、头部和手指)的高速率(200Hz)连续控制,支持多机器人协作,多个机器人共用同一组神经网络权重完成任务。Helix 基于自然语言指令拿起从未见过的物品,表现出强大的泛化能力。Helix 的训练完全端到端,无需任务特定的微调,在低功…- 4
-
Cline – AI编程助手,集成于 VSCode 实时检查语法错误
Cline项目简介 Cline 是集成于 VSCode 的 AI 编程助手,通过智能化手段提升开发效率。具备强大的代码生成与编辑能力,能根据用户需求快速创建或修改代码文件,实时检查语法错误。Cline 支持在终端执行命令,帮助开发者完成诸如安装依赖、运行脚本等操作。 对于 Web 开发,Cline 可以通过无头浏览器启动网站,进行交互操作并捕获日志,助力调试和优化。支持多语言模型,根据需求选择免费…- 6
-
豆包PixelDance – 字节跳动推出的AI视频生成大模型,基于DiT结构
豆包PixelDance项目简介 豆包PixelDance是字节跳动最新推出的AI视频生成模型,采用DiT结构,支持文生视频和图生视频。它能理解复杂指令,生成长达10秒的连贯视频片段,涵盖多主体交互和时序性动作。豆包PixelDance模型具备卓越的语义理解力和丰富的运镜效果,能一键生成具有故事性的多镜头短片。豆包PixelDance支持多种风格和视频比例,适用于影视、广告、短视频等多种场景,极大…- 4
-
DiffEditor – 北大联合腾讯推出的细粒度图像编辑工具
DiffEditor项目简介 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的图像编辑工具,通过引入图像提示(image prompts)和文本提示,结合区域随机微分方程(Regional SDE)和时间旅行策略,显著提升了图像编辑的准确性和灵活性。DiffEditor支持多种编辑任务,包括单图像内的对象移动、调整大小和内容拖动…- 1
-
OmniBooth – 华为诺亚方舟联合港科大推出的图像生成框架
OmniBooth项目简介 OmniBooth是华为诺亚方舟实验室和港科大研究团队共同推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。框架用用户定义的掩码和相关联的文本或图像指导精确控制图像中对象的位置和属性,提升文本到图像合成技术的可控性和实用性。OmniBooth的核心在于创新的潜在控制信号,一种高维空间特征,能无缝整合空间、文本和图像条件,实现细粒度的图像合成控制。 …- 2