-
DeepSeek-R1 – DeepSeek推出的高性能AI推理模型,性能对标OpenAI o1正式版
DeepSeek-R1项目简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。DeepSeek-R1推理模型通过大规模强化学习技术进行后训练,仅需极少量标注数据,便能在数学、代码和自然语言推理等任务上取得卓越表现。DeepSeek-R1遵循MIT License开源,支持模型蒸馏,训练其他模型。 DeepSeek-R1优势介绍 …- 0
- 0
-
TinyR1-Preview – 奇虎360联合北大团队推出的推理模型
TinyR1-Preview项目简介 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参数量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在数学领域(AIME评测78.1分)逼近原版R1(79.8分),远超70B的Deepseek-R1-Distill-Llama(70.0分)。TinyR1-Preview基于…- 0
- 0