全部标签

应用

深度解析ControlNet模型的工作原理与应用场景（附案例解析）

一、川言川语大家好，我是言川。本期文章是2024年的第一篇文章，也是2023年农历的最后一篇文章。截至这篇文章完成时，距离春节也只有最后一周的时间了，我无法单独向支持我的朋友们传达祝福之意。所以在本篇文章的开头，向大家说一些祝福之词： 2024年，祝大家在新的一年里事业有成，大展宏图，前程似锦。同时在事业之外，祝大家健康、快乐以及幸福。 2024年，辰龙年，祝大家龙飞凤舞，事业腾飞;祝大家金龙献…
AI教程
- 2
- 0
AI逻界12小时前
Slack 全面拥抱 AI:可以总结聊天内容、解释术语并实现工作自动化

Slack 正推出一系列广泛的人工智能功能，旨在简化日常任务，并将消息平台转型为企业生产力的核心枢纽。此举标志着其母公司 Salesforce 对微软在工作场所 AI 领域主导地位的直接挑战。这些预计在未来几个月内陆续推出的更新，将包括直接嵌入 Slack 画布中的 AI 写作辅助功能、上下文消息解释、自动化行动项目识别，以及横跨多个关联业务应用程序的企业搜索功能。与此同时，Salesforce…
AI资讯
- 1
- 0
AI逻界12小时前
Recraft V3 – Recraft推出的AI文本到图像生成模型

Recraft V3项目简介 Recraft V3是Recraft公司推出的AI文本到图像生成模型，在Hugging Face的文本到图像模型排行榜上以1172的ELO评分荣获第一。模型具有高质量的图像生成和先进的设计控制功能，支持用户精确定位文本和元素，定制品牌风格和颜色。Recraft V3支持长文本生成，提供用户友好的界面和灵活的定价策略，能通过网站、移动应用或API使用，为设计师和创意专业…
工具测评
- 0
- 0
AI逻界13小时前
Promptic – 轻量级LLM应用开发框架，通过一行代码切换不同LLM

Promptic项目简介 Promptic是轻量级的LLM应用开发框架，提供高效且符合Python风格的开发方式。基于LiteLLM，Promptic支持开发者能轻松切换不同的LLM服务提供商，只需更改一行代码。Promptic支持流式响应、内置对话记忆、错误处理和重试，及可扩展的状态管理。帮助开发者专注于构建功能，而不是底层的复杂性。Promptic的灵活性和易用性让其成为LLM开发领域的有力助…
工具测评
- 1
- 0
AI逻界7月29日
MagicClay – Adobe 推出的3D建模工具，文本引导3D模型局部雕刻

MagicClay项目简介 MagicClay 是 Adobe 推出3D建模工具，结合网格和有向距离场（SDF）技术，支持艺术家基于文本提示对3D模型的特定部分进行雕刻，同时保持模型的其他区域不变。MagicClay 支持生成具有纹理的三维模型，能非破坏性地编辑局部网格，让艺术家用文本提示为基础，对3D模型进行更直观和更精细的编辑。MagicClay 将文本到图像的生成能力转化为艺术家在迭代工作流…
工具测评
- 1
- 0
AI逻界7月29日
HuggingChat macOS – Hugging Face开源的macOS聊天应用程序

HuggingChat macOS项目简介 HuggingChat macOS是Hugging Face推出的开源聊天应用程序，专为macOS用户设计，基于强大的开源语言模型，将先进的AI对话能力直接带到用户的桌面上。应用支持多种顶尖的开源大语言模型，如Qwen 2.5 72B、Command R+、Phi 3.5、Mistral 12B等。HuggingChat macOS提供丰富的功能，包括网…
工具测评
- 1
- 0
AI逻界7月29日
AI绘画进阶入门ComfyUI系列教程第八章，只需一步极速出图，实时绘画！！

【视频简介】本视频是一期关于ComfyUI系列教程的内容，主要介绍了LCM和Turbo两种极速出图的方法以及实时绘画的技巧。视频中演示了如何在ComfyUI中使用LCM和Turbo进行实时绘画，并提到了使用XL模型进行二次精炼的方法。LCM和Turbo都是提高出图效率的有效方法，具体选择哪种方法取决于个人需求和实际情况。此外，视频还提到了实时修改图像的颜色、背景和服装的方法，以及使用绘画组件进行…
AI教程
- 3
- 0
AI逻界7月29日
ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose项目简介 ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络，通过将输入图像切块并送入 Transformer block 来提取特征，再经解码器将特征解码为热图，实现对人体关键点的精准定位。ViTPose 系列模型具有多种规模版本，如 ViTPose-B、ViTPose-L、ViTPose-H 等，可根据不同需求…
工具测评
- 0
- 0
AI逻界7月29日
Steam 平台 AI 游戏数量飙升800%:生成式 AI 已渗透游戏开发

据国外媒报道称，今年以来，Steam 平台上公开披露使用生成式 AI 技术的游戏数量激增了800%。这表明生成式 AI 在游戏开发领域的应用正在迅速普及。图源备注：图片由AI生成，图片授权服务商Midjourney 根据 Totally Human 对 Steam 游戏的分析，目前已有近 8000款游戏在其说明中提及使用了生成式 AI。这一数字在一年前还不到1000款，增长幅度惊人。这些 AI…
AI资讯
- 1
- 0
AI逻界7月28日
FastExcel – 开源的高性能 Excel 处理工具

FastExcel项目简介 FastExcel是基于Java的开源库，提供快速、简洁且能解决大文件内存溢出问题的Excel处理工具。FastExcel兼容EasyExcel，提供性能优化、bug修复，新增如读取指定行数和转换为PDF功能。FastExcel以MIT协议发布，适用于任何商业场景，基本高性能读写、简单易用API和流式操作能力，适合处理大规模数据。支持无缝从EasyExcel迁移，简化E…
工具测评
- 3
- 0
AI逻界7月28日
因赛AIGC – 因赛集团推出的AI营销工具

因赛AIGC项目简介因赛AIGC是因赛集团推出的AI营销工具，InsightGPT结合AI技术与营销策略洞察、内容创意生产、传播投放及效果转化，提升营销行业的生产力。InsightGPT不仅具备图片创作、文案生成等基础功能，还通过智能化处理降低创作门槛，提高内容品质，生成更贴合用户需求的营销内容。InsightGPT的推出，展示了因赛集团在AIGC领域的专业领先优势，为营销行业带来创新解决方案。…
工具测评
- 2
- 0
AI逻界7月28日
小米汽车新功能 “快捷找车”：自动拍照 + AI 识别

小米在智能汽车领域再度发力，推出了 “快捷找车” 功能，旨在解决车主在停车场找车时的烦恼。该功能首批应用于小米 YU7车型，用户只需在小米汽车 App 中简单设置，锁车时车辆将自动拍摄周围环境的五个角度照片，极大地方便了车主寻找爱车的过程。随着城市生活节奏的加快，很多车主常常在大型商场或写字楼的停车场中迷失方向，常常需要在车流如织的环境中找寻自己的爱车。小米意识到这一痛点，创新推出了这一实用功能…
AI资讯
- 2
- 0
AI逻界7月28日
ChatGPT录音模式面向Plus用户全面开放，已在macOS桌面应用上线

人工智能技术的快速发展正在持续改变我们的工作与生活方式。近日，OpenAI宣布其ChatGPT的录音模式（Record Mode）已向所有Plus用户全面推出，为用户提供更高效的语音交互体验。这一功能目前已在macOS桌面应用程序中上线，成为会议记录、头脑风暴和灵感捕捉的强大工具。录音模式正式上线，Plus用户率先体验 ChatGPT的录音模式允许用户通过语音直接与AI交互，并支持实时记录和内容…
AI资讯
- 1
- 0
AI逻界7月28日
QVQ-Max – 阿里通义推出的视觉推理模型

QVQ-Max项目简介 QVQ-Max 是阿里通义推出的视觉推理模型，是QVQ-72B-Preview的正式升级版。QVQ-Max能“看懂”图片和视频内容，结合信息进行分析、推理和解决问题。QVQ-Max支持应用于学习、工作和生活场景，如解答数学难题、协助数据分析、提供穿搭建议等。QVQ-Max在视觉推理能力上展现出强大的潜力，有望成为实用的视觉智能助手，帮助人们解决更多实际问题。 QVQ-Max…
工具测评
- 2
- 0
AI逻界7月27日
BodyTalk – AI视频配音工具，自动适配新语音的唇形、面部表情和肢体动作

BodyTalk项目简介 BodyTalk是Panjaya推出的AI视频配音工具，基于生成性AI技术，将视频中的人物声音转换为其他语言，自动调整视频中人物的面部表情和肢体动作，自然地匹配新的语音模式。工具结合音频翻译、声音模仿和视频编辑技术，支持29种语言的翻译，提供自动化处理和编辑功能。BodyTalk主要面向B2B市场，与JFrog和TED等组织合作，提升视频内容的观看率和完成率。 BodyT…
工具测评
- 2
- 0
AI逻界7月27日
GaussianEditor – 一种3D编辑算法，支持快速且精确地修改3D场景

GaussianEditor项目简介 GaussianEditor 是一种基于高斯飞溅（Gaussian Splatting）的3D编辑算法，支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅，提供了高度的编辑控制和稳定性，同时保持了渲染质量。编辑过程通常只需5-10分钟，显著提高了3D编辑的效率。这项技术特别适合游戏开发和虚拟现实等领域，具有广泛的应用前景。 GaussianEdi…
工具测评
- 0
- 0
AI逻界7月27日
CHANGER – AI换头技术，将演员头部无缝集成到目标身体

CHANGER项目简介 CHANGER是工业级超自然AI换头与色键技术，用在数字内容创作中将演员头部无缝集成到目标身体上，适于视觉特效、数字人类创建和虚拟化身。CHANGER基于色键技术分离背景与前景，用H2增强模拟多样头部形状和发型，及FPAT模块预测、聚焦关键区域，实现高保真融合。CHANGER在性能上超越现有技术，适用于多种真实场景。 CHANGER优势介绍高保真头部融合：将演员的头部无缝…
工具测评
- 1
- 0
AI逻界7月27日
Skywork o1 – 昆仑万维推出的天工大模型4.0 o1版

Skywork o1项目简介 Skywork o1是昆仑万维推出的天工大模型4.0 o1版，是国内首款具备中文逻辑推理能力的o1模型。Skywork o1在模型输出中内生了思考、计划、反思等能力，显著提升推理能力。Skywork o1模型包括基于开源Llama 3.1 8B的模型和进阶能力更强的版本，推动AI深度思考和复杂推理能力的发展，是追求AGI（人工通用智能）的重要一步。 Skywork o…
工具测评
- 0
- 0
AI逻界7月26日
FinRobot – 开源 AI Agent 平台，解决金融领域应用的综合解决方案

FinRobot项目简介 FinRobot是开源的AI代理平台，专注于金融领域的应用。基于大型语言模型（LLMs）来构建能进行复杂分析和决策的金融专业AI代理。平台通过金融思维链（CoT）提示功能，将难题分解成逻辑步骤，增强分析能力。FinRobot通过开源项目，让更多人能访问和使用金融专业LLM工具，促进AI在金融决策中的广泛应用。架构包括金融AI代理层、金融LLM算法层、LLMOps和Data…
工具测评
- 0
- 0
AI逻界7月26日
CapsWriter-Offline – AI语音转文字工具，PC端离线实时工作

CapsWriter-Offline项目简介 CapsWriter-Offline是一款高效的PC端离线语音输入和字幕转录工具，支持用户通过简单的按键操作实现实时语音转文字。软件适合快速记录和转写大量语音信息的场景，如会议、讲座或个人笔记。用户按下大写锁定键即可开始录音，松开后软件迅速将语音转换为文本。CapsWriter-Offline支持将音视频文件拖拽到客户端，快速生成SRT字幕文件，适合视…
工具测评
- 0
- 0
AI逻界7月25日
OpenCity – AI交通预测模型，卓越的零样本预测和情境适应能力

OpenCity项目简介 OpenCity是由香港大学联合华南理工大学和百度共同研发的交通预测模型。OpenCity采用Transformer架构和图神经网络，通过大规模预训练学习交通数据的时空依赖关系，具备卓越的零样本预测能力和快速情境适应能力，有效应对不同区域和时间的交通模式变化，推动智慧交通发展。 OpenCity优势介绍通用时空建模：有效处理不同空间区域和时间的城市交通模式的多样性和变化…
工具测评
- 2
- 0
AI逻界7月24日
Fast GraphRAG – 微软推出高效的知识图谱检索框架

Fast GraphRAG项目简介 Fast GraphRAG 是微软推出的高效的知识图谱检索框架，旨在提供可解释性和高精度的代理驱动检索工作流。它结合了检索增强生成（RAG）技术和知识图谱，提升大型语言模型（LLMs）在处理私有数据和复杂数据集时的性能。Fast GraphRAG 无缝融入检索管道，提供高级 RAG 的强大功能，无需构建和设计Agent工作流程的开销。具备可解释和可调试的知识、快…
工具测评
- 2
- 0
AI逻界7月24日
LBM – AI图像转换框架，实现可控阴影生成

LBM项目简介 LBM（Latent Bridge Matching）是Jasper Research团队推出的新型图像到图像转换框架，基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推理完成任务，适用多种图像转换场景，如目标移除、重打光、深度和法线估计等。LBM用布朗桥在源图像和目标图像之间建立随机路径，增加样本多样性。条件框架能实现可控的阴影生成和图像重光照。LBM在多项任务中…
工具测评
- 4
- 0
AI逻界7月24日
飞书发布多款 AI 新产品，助力企业打造智能化办公新生态！

在7月9日的最新发布会上，飞书推出了多款令人瞩目的 AI 产品，包括知识问答、AI 会议、Aily 以及飞书妙搭等。这些创新产品的推出，旨在帮助企业更好地满足日常运营需求，赋能其智能化转型。飞书 CEO 谢欣强调:“我们致力于为企业提供真正可用的 AI 产品，成为值得信赖的 AI 伙伴。” 值得注意的是，飞书的王牌产品 —— 多维表格，最近完成了一次重大更新，现已具备替代小型业务系统的能力。企业可…
AI资讯
- 3
- 0
AI逻界7月24日