研究揭示：大模型在回答中易重复有害的错误信息

大型语言模型研究揭示：易重复有害的错误信息

最新研究表明，大型语言模型存在重复有害的错误信息的问题。滑铁卢大学的研究人员对ChatGPT早期版本进行了系统测试，发现其在回答问题时经常重复阴谋论、有害的刻板印象和其他形式的错误信息。

研究人员使用四种不同的查询模板，询问了六类事实和错误信息中的1200多种陈述。分析结果表明，GPT-3在4.8% 到26% 的时间内同意错误的陈述，具体取决于陈述类别。

此外，研究人员还发现，大型语言模型在回答问题时存在自相矛盾的情况。即使是最轻微的措辞变化也会完全改变答案，这使得模型的回答变得不可预测且令人困惑。

这项研究强调了大型语言模型在处理信息时的局限性，并提醒人们在使用这些模型时需要保持警惕。尽管这些模型在处理语言方面表现出色，但它们仍然存在潜在的风险，尤其是在处理有害信息时。

这项研究的结果对于我们理解和评估大型语言模型的能力具有重要意义。未来需要进一步的研究来探索如何改进这些模型，以减少错误信息的重复和传播。同时，用户在使用这些模型时也需要保持警觉，避免被错误信息误导。

暂无评论

暂无评论...