-
AI聊天越久越”糊涂”:微软研究揭示语言模型可靠性骤降39%
微软和Salesforce联合研究发现,即使是最先进的AI语言模型在长时间对话中也会出现严重的可靠性问题。当用户逐步表达需求时,系统性能平均下降39%,这一发现对AI助手的实际应用提出了重要警示。 模拟真实交互揭示性能缺陷 研究团队创建了名为"分片"的测试方法,模拟用户在实际对话中逐步明确需求的过程。与传统的一次性提供完整信息不同,这种方法将任务分解为多个步骤,更贴近真实使用场…- 2
- 0
-
OpenAI 计划发布开放权重模型,打破“闭源”惯例
据知情人士透露,OpenAI 正在准备推出其首个开放权重模型,最早可能于下周发布。这款新的语言模型将允许公司和政府在 OpenAI 和微软 Azure 服务器之外的供应商上自行运行,标志着 OpenAI 自2019年发布 GPT-2以来首次发布开放权重模型。 此举也打破了 OpenAI 自2023年与微软签署独家云提供商协议以来,其语言模型一直保持闭源的惯例。 OpenAI 的模型通常是闭权的,这…- 3
- 0