-
LongRAG – 智谱联合清华和中科院推出的双视角鲁棒检索框架
LongRAG项目简介 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器四个组件,有效解决长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上超越长上下文LLM、高级RAG系统和Vanilla RAG等基线模型,展现出卓越的性…- 0
-
超多细节,尽显大宋盛世!Stable Diffusion写实风复刻《清明上河图》,AI绘画技术实现风格迁移实战
AI绘画工具:Stable Diffusion 工具介绍:Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像。 工具链接:https://www.aieva.cn/sites/411.html AI绘画技术越来越发达,超乎想…- 0
-
YuLan-OneSim – 人大高瓴AI团队推出的社会模拟器
YuLan-OneSim项目简介 YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构建模拟场景,基于自然语言交互生成代码。YuLan-OneSim提供50多个涵盖8个主要社会科学领域的默认场景,支持高达10万Agents的大规模模拟,基于外部反馈自动优化LLM。YuLan…- 2
-
StockMixer – 上海交大推出的股票价格预测架构
StockMixer项目简介 StockMixer是上海交通大学推出的用在股票价格预测的多层感知器(MLP)架构,具备简单和强大的预测能力。架构基于指标混合、时间混合和股票混合三个步骤处理和预测股票数据,有效捕捉股票指标、时间和股票间的复杂相关性。时间混合用多尺度时间片段信息,股票混合基于市场状态影响个股,实现更准确的预测。StockMixer在减少内存使用和计算成本的同时,在多个股票市场基准测试…- 1
-
赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
Chitu项目简介 Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适配能力,支持英伟达多款GPU及国产芯片,打破了对特定硬件(如英伟达Hopper架构)的依赖。 在性能方面,在A800集群上部署DeepSeek-R1-671B时,相比部分国外开源框架,GPU使用量减少50%,推理速度提升3.15…- 1
-
Midjourney角色一致性测评体验使用场景探讨
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。 "人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与&q…- 3
-
HouseCrafter – 东北大学和 Stability AI推出2D转换3D室内场景的技术
HouseCrafter项目简介 HouseCrafter 是由东北大学和 Stability AI 推出的先进技术,将二维平面图自动转换成三维室内场景。基于一个网络规模图像训练的2D扩散模型,生成一致的多视图彩色(RGB)和深度(D)图像。图像自回归地批量生成,确保全局一致性,重建出高质量的3D场景。简化复杂虚拟环境的创建过程,基于用户交互功能,支持用户在平面图上移动家具轻松编辑场景布局,实时更…- 1
-
DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计
DeepEP项目简介 DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内和节点间的 NVLink 和 RDMA 通信。DeepEP 特别针对 DeepSeek-V3 论文中的组限制门控算法进行了优化,支持 FP8 数据格式调度,引入了基于 Hook 的通信-计算重叠方法,不占…- 0