全部标签

谷歌DeepMind

SCoRe – 谷歌DeepMind推出的多轮强化学习方法

SCoRe项目简介 SCoRe（Self-Correction via Reinforcement Learning）是谷歌DeepMind推出的一种创新的多轮强化学习方法，旨在提高大型语言模型（LLM）的自我纠错能力。通过在模型生成的数据上进行训练，使模型在没有外部指导的情况下，对错误答案进行自我纠正。SCoRe的训练包括两个阶段：第一阶段通过适当的正则化约束来初始化模型，避免在训练过程中出现模…
工具测评
- 2
- 0
AI逻界6月8日
PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型

PaliGemma 2 mix项目简介 PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型（VLM）。集成了多种视觉和语言处理能力，支持图像描述、目标检测、图像分割、OCR以及文档理解等任务，能在单一模型中灵活切换不同功能。模型提供三种不同参数规模（3B、10B、28B），满足不同场景的需求，同时支持224px和448px两种分辨率，兼顾性能与资源平衡。PaliGem…
工具测评
- 1
- 0
AI逻界6月6日