-
YuLan-OneSim – 人大高瓴AI团队推出的社会模拟器
YuLan-OneSim项目简介 YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构建模拟场景,基于自然语言交互生成代码。YuLan-OneSim提供50多个涵盖8个主要社会科学领域的默认场景,支持高达10万Agents的大规模模拟,基于外部反馈自动优化LLM。YuLan…- 2
-
StockMixer – 上海交大推出的股票价格预测架构
StockMixer项目简介 StockMixer是上海交通大学推出的用在股票价格预测的多层感知器(MLP)架构,具备简单和强大的预测能力。架构基于指标混合、时间混合和股票混合三个步骤处理和预测股票数据,有效捕捉股票指标、时间和股票间的复杂相关性。时间混合用多尺度时间片段信息,股票混合基于市场状态影响个股,实现更准确的预测。StockMixer在减少内存使用和计算成本的同时,在多个股票市场基准测试…- 1
-
赤兔Chitu – 清华联合清程极智开源的大模型推理引擎
Chitu项目简介 Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件适配能力,支持英伟达多款GPU及国产芯片,打破了对特定硬件(如英伟达Hopper架构)的依赖。 在性能方面,在A800集群上部署DeepSeek-R1-671B时,相比部分国外开源框架,GPU使用量减少50%,推理速度提升3.15…- 2
-
Midjourney角色一致性测评体验使用场景探讨
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。 "人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与&q…- 4
-
HouseCrafter – 东北大学和 Stability AI推出2D转换3D室内场景的技术
HouseCrafter项目简介 HouseCrafter 是由东北大学和 Stability AI 推出的先进技术,将二维平面图自动转换成三维室内场景。基于一个网络规模图像训练的2D扩散模型,生成一致的多视图彩色(RGB)和深度(D)图像。图像自回归地批量生成,确保全局一致性,重建出高质量的3D场景。简化复杂虚拟环境的创建过程,基于用户交互功能,支持用户在平面图上移动家具轻松编辑场景布局,实时更…- 1
-
DeepEP – DeepSeek 开源的专家并行通信库,专为 MoE 训练和推理设计
DeepEP项目简介 DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内和节点间的 NVLink 和 RDMA 通信。DeepEP 特别针对 DeepSeek-V3 论文中的组限制门控算法进行了优化,支持 FP8 数据格式调度,引入了基于 Hook 的通信-计算重叠方法,不占…- 0
-
Llama 4 – Meta 开源的多模态系列AI模型,重夺开源王座
Llama 4项目简介 Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个版本。Scout 有 170 亿个活跃参数、16 个 “专家” 模型、1090 亿个总参数,支持 1000 万上下文,可处理 20 多小时视频,在单个 H100 GPU 上就能运行,性能超越 Gem…- 0
-
Cognita – 面向生产环境的开源、模块化 RAG 框架
Cognita项目简介 Cognita是开源的模块化RAG(Retrieval Augmented Generation)框架,能帮助开发者构建模块化、易于扩展和部署的生产级应用程序。Cognita用Langchain/LlamaIndex作为底层技术,提供代码组织结构,让每个组件都能通过API驱动,易于管理和扩展。Cognita支持本地部署,提供生产就绪环境及无代码UI支持,默认支持增量索引功能…- 0