-
嫦娥、玉兔、圆月…要素集齐!分享中秋节海报AI设计思路实战案例附关键词
家人们呐,还有10天左右,就迎来今年的中秋节了!? 中秋国庆连续放假8天,想想都挺美!? 想必这时候,家人们已经开始考虑中秋的主题海报思路了。 AI元年,AI绘画会给我们带来很多意想不到的惊喜! 在此分享一组出品精美,以“嫦娥”和“玉兔”为画面主体的“咒语”?,直接套用关键词,可以非常快速地制作中秋节海报。 嫦娥为主体 玉兔与月饼为主题 单纯以月饼为主题 这一次生成没有垫图,用Midjourney…- 3
-
Agent TARS – 字节跳动开源的多模态 AI Agent 项目
Agent TARS项目简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TARS 提供桌面客户端,展示多模态元素和对话流程。Agent TARS凭借开源特性和强大的工具集成能力,成为 AI 辅助任务执行和研究的强大工具。Agent TARS目前处于技术预览阶段,仅支持 mac…- 4
-
Step-1o Audio – 阶跃星辰推出的国内首个千亿参数端到端语音大模型
Step-1o Audio项目简介 Step-1o Audio是阶跃星辰推出的国内首个千亿参数端到端语音大模型。具备强大的情绪感知能力,能精准识别用户语气中的情感,结合语境做出贴心回应。如,在用户分享喜悦时,能恰如其分地提问;在用户感到疲惫时,能提供安慰和建议。Step-1o Audio 支持多语种和方言理解,能用四川话等方言自然交流,精准把握语调和词汇。具备个性化风格表达,可根据场景调整语气。 …- 4
-
Omni Reference – Midjourney V7推出的图像参考功能
Omni Reference项目简介 Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Midjourney V7 版本,支持个性化、风格化和情绪板等功能。Omni Reference 支持基于 Web 端拖拽图像或在 Discord 中使用 --oref 命令实现,基于-…- 1
-
Lumina-Image 2.0 – 上海 AI Lab 开源的统一图像生成模型
Lumina-Image 2.0项目简介 Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构。在图像生成质量、复杂提示理解和资源效率方面表现出色,在文本对齐能力上达到行业领先水平,能根据文本描述生成高质量、多风格的图像。模型支持多种推理求解器,如中点求解器、欧拉求解器和DPM求解器,生成速度较快。 Lumina-Image 2.…- 3
-
引爆热议!AIGC应用于医疗诊断实战:美国男孩怪病缠身3年求医数十人无果,最终被ChatGPT成功诊断
AI奇点网9月18日报道丨小编最近了解到了一件很匪夷所思但是又很令人深思的事件。这是发生在一名美国4岁小男孩Alex身上的真实经历。AI奇点网从外媒获悉,2020年,Alex在某次运动后,他身体开始剧痛。母亲前后带她看了17名医生,从儿科、骨科到各种专家,先后进行了MRI等一系列检查,但没一个真正找出病因。 今年,Alex的母亲起初没有抱太大的希望,她开始尝试求助于ChatGPT的对话聊天机器人,…- 3
-
NanoFlow – 优化大语言模型推理吞吐量的服务框架
NanoFlow项目简介 NanoFlow 是一个高性能的服务框架,专为大型语言模型(LLMs)设计,以提高模型的推理吞吐量。它通过在单个设备内部并行使用计算、内存和网络资源,优化了模型的推理过程。并行处理机制使得 NanoFlow 能同时处理更多的请求,并且保证快速响应,从而显著提升了系统的整体性能和用户体验。 NanoFlow优势介绍 提高推理吞吐量:NanoFlow 的核心目标是最大化模型的…- 3
-
Helix – Figure 推出的端到端通用控制模型
Helix项目简介 Helix 是 Figure 推出的通用视觉-语言-动作(VLA)模型,用于人形机器人的控制。Helix首创性地实现对机器人整个上身(包括手腕、躯干、头部和手指)的高速率(200Hz)连续控制,支持多机器人协作,多个机器人共用同一组神经网络权重完成任务。Helix 基于自然语言指令拿起从未见过的物品,表现出强大的泛化能力。Helix 的训练完全端到端,无需任务特定的微调,在低功…- 4