全部标签

实验室

ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架

ArtCrafter项目简介 ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架，基于扩散模型，解决传统方法在风格表达、内容一致性和输出多样性方面的局限。ArtCrafter基于嵌入重构架构实现，包含三个关键组件：基于注意力的风格提取模块，用多层架构和感知器注意力机制从参考图像中提取细腻的风格特征；文本-图像对齐增强模块，基于注意力交互将图像和文本嵌入映射到共享…
工具测评
- 0
- 0
AI逻界6月20日
Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具

Textoon项目简介 Textoon是阿里巴巴集团通义实验室推出的创新项目，首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型，能在一分钟内生成多样化且可交互的2D角色。生成的角色支持动画效果，适用于HTML5渲染，可广泛应用于影视、游戏、社交媒体和广告等领域。 Textoon优势介绍文本解析：Textoon 使用微调的大语言模型（LLM），能够从复杂文本中提取…
工具测评
- 0
- 0
AI逻界6月20日
OmniThink – 浙大联合阿里通义实验室推出的深度思考机器写作框架

OmniThink项目简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架，通过模拟人类的迭代扩展和反思过程，突破大型语言模型在机器写作中的知识边界。框架通过信息树和概念池的结构化组织，逐步深化对主题的理解，生成高质量的长篇文章。OmniThink的核心优势在于独特的迭代扩展和反思机制，能有效提升生成文章的知识密度，减少冗余信息，同时保持文章的连贯性和深度。实验结果表…
工具测评
- 0
- 0
AI逻界6月19日
ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架

ClearerVoice-Studio项目简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架，集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法，有效消除背景噪声，保留语音清晰度，保持语音失真最小化。ClearerVoice-Studio 提供先进的预训练模型和训练脚本，支持研究人员和开发者进行语音处理任务，推动语音处理技术的创新应用。 …
工具测评
- 0
- 0
AI逻界6月14日
PPTAgent – 中科院推出的自动生成高质量演示文稿框架

PPTAgent项目简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架，基于模仿人类工作流程的两阶段编辑方法，从文档自动生成高质量的演示文稿。PPTAgent分析参考演示文稿，提取结构模式和内容模式，基于代码动作草拟大纲并生成幻灯片，确保内容的一致性和对齐。PPTAgent基于大型语言模型（LLM）的能力，将演示文稿生成过程分解为迭代的编辑工作流程，提高生成演示文稿的连贯…
工具测评
- 2
- 0
AI逻界6月10日
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型

SoulChat2.0项目简介 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数字孪生任务，旨在通过模拟真实心理咨询师的语言风格和疗法技术，提升大模型在真实心理咨询场景中的应用性能。SoulChat2.0能低成本、快速、高效地构建具有特定心理咨询师风格的心理健康大模型，辅助心理…
工具测评
- 4
- 0
AI逻界6月6日