-
ArtCrafter – 清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架
ArtCrafter项目简介 ArtCrafter是清华大学、鹏城实验室和联想研究院共同推出的文本到图像风格迁移框架,基于扩散模型,解决传统方法在风格表达、内容一致性和输出多样性方面的局限。ArtCrafter基于嵌入重构架构实现,包含三个关键组件:基于注意力的风格提取模块,用多层架构和感知器注意力机制从参考图像中提取细腻的风格特征;文本-图像对齐增强模块,基于注意力交互将图像和文本嵌入映射到共享…- 0
- 0
-
Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具
Textoon项目简介 Textoon是阿里巴巴集团通义实验室推出的创新项目,首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型,能在一分钟内生成多样化且可交互的2D角色。生成的角色支持动画效果,适用于HTML5渲染,可广泛应用于影视、游戏、社交媒体和广告等领域。 Textoon优势介绍 文本解析:Textoon 使用微调的大语言模型(LLM),能够从复杂文本中提取…- 0
- 0
-
OmniThink – 浙大联合阿里通义实验室推出的深度思考机器写作框架
OmniThink项目简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架,通过模拟人类的迭代扩展和反思过程,突破大型语言模型在机器写作中的知识边界。框架通过信息树和概念池的结构化组织,逐步深化对主题的理解,生成高质量的长篇文章。OmniThink的核心优势在于独特的迭代扩展和反思机制,能有效提升生成文章的知识密度,减少冗余信息,同时保持文章的连贯性和深度。实验结果表…- 0
- 0
-
ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架
ClearerVoice-Studio项目简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算法,有效消除背景噪声,保留语音清晰度,保持语音失真最小化。ClearerVoice-Studio 提供先进的预训练模型和训练脚本,支持研究人员和开发者进行语音处理任务,推动语音处理技术的创新应用。 …- 0
- 0
-
PPTAgent – 中科院推出的自动生成高质量演示文稿框架
PPTAgent项目简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。PPTAgent分析参考演示文稿,提取结构模式和内容模式,基于代码动作草拟大纲并生成幻灯片,确保内容的一致性和对齐。PPTAgent基于大型语言模型(LLM)的能力,将演示文稿生成过程分解为迭代的编辑工作流程,提高生成演示文稿的连贯…- 2
- 0
-
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型
SoulChat2.0项目简介 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数字孪生任务,旨在通过模拟真实心理咨询师的语言风格和疗法技术,提升大模型在真实心理咨询场景中的应用性能。SoulChat2.0能低成本、快速、高效地构建具有特定心理咨询师风格的心理健康大模型,辅助心理…- 4
- 0