本文是LLM系列文章,针对《Improving Factuality in Large Language Models via Decoding-Time Hallucinatory and Truthful Comparators》的翻译。
摘要
尽管其能力非凡,大型语言模型(LLM)很容易生成与可验证事实相矛盾的响应,即不忠实的幻觉内容。现有的工作通常集中在优化模型参数或编辑语义表示,这会损害目标LLM的内部事实知识。此外,幻觉通常在下游任务中表现出多方面的模式,限制了模型跨任务的整体性能。在本文中,我们提出了一种比较器驱动的解码时间(CDT)框架来减轻响应幻觉。首先,我们利用多任务微调样本构建幻觉和真实的比较器。在这种情况下,我们提出了一种指令原型引导的专家混合策略,以增强相应比较器在不同任务指令中捕获不同幻觉或真实模式的能力。 CDT通过对比目标 LLM 和这些比较器之间的 logit 差异,将下一个token预测限制为事实稳健的分布。对多个下游任务的系统实验表明,我们的框架可以显着提高模型性能和响应真实性。