-
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型
SoulChat2.0项目简介 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数字孪生任务,旨在通过模拟真实心理咨询师的语言风格和疗法技术,提升大模型在真实心理咨询场景中的应用性能。SoulChat2.0能低成本、快速、高效地构建具有特定心理咨询师风格的心理健康大模型,辅助心理…- 1
-
StyleShot – 开源的AI图像风格迁移模型
StyleShot项目简介 StyleShot 是开源的AI图像风格迁移模型,无需额外训练即可实现任意风格到任意内容的迁移。通过风格感知编码器提取风格特征,基于内容融合编码器加强风格与内容的整合。StyleShot 能捕捉从基本元素到复杂细节的多种风格特征,并支持文本和图像驱动的风格迁移。 StyleShot优势介绍 文本驱动风格迁移:用户可以提供文本描述和风格参考图像,StyleShot 将生成…- 1
-
Llama-3.1-Minitron – 英伟达联合Meta推出的Llama 3.1 4B参数模型
Llama-3.1-Minitron项目简介 Llama-3.1-Minitron是由英伟达和Meta合作开发的AI模型,通过剪枝和知识蒸馏技术从Llama 3.1 8B模型精炼而成的更小型4B参数模型。这种优化减少了模型大小和复杂性,同时保持了核心性能。Llama-3.1-Minitron 4B在多个基准测试中表现优异,与更大模型相比具有竞争力,且在FP8精度下吞吐量提升显著,是AI绘画和写作等…- 1
-
FoxBrain – 鸿海研究院推出的推理大语言模型
FoxBrain项目简介 FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域。FoxBrain 基于高效训练策略,用四周时间完成训练,使用 120 张 NVIDIA H100 GPU,展现了高效率和低成本的特点。FoxBrain基于自主技术生成高质量中文预训练数据,用 Ada…- 1
-
MATRIX-Gen – 上海交大联合牛津大学推出的多智能体模拟系统
MATRIX-Gen项目简介 MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的AI智能体组成的社会,生成多样化且高质量的训练指令数据。训练指令数据用在大型语言模型(LLMs)的后训练,提升模型遵循人类指令的能力,在多个任务中展现出优异的性能。MATRIX-Gen根据不同需求合成指令,包括通用和特定领域的数据集,推动了大模型自我进化…- 1