本文是LLM系列文章,针对《Large Language Model based Situational Dialogues for Second Language Learning》的翻译。
摘要
在第二语言学习中,基于情景的会话练习对于语言学习者实现口语流利性很重要,但学生往往缺乏足够的机会与合格的教师或母语人士一起练习会话技能。为了弥补这一差距,我们提出了情景对话模型,供学生进行对话练习。我们的情景对话模型在大型语言模型(LLM)的基础上进行了微调,目的是将开放式对话的引人入胜的性质与基于场景的任务的集中实践相结合。利用LLM的泛化能力,我们证明了我们的情景对话模型不仅在训练主题上有效,而且在训练中未遇到的主题上也有效。这提供了一个很有前途的解决方案,可以在不需要大量手动工作的情况下支持广泛的对话主题。此外,对话系统领域的研究仍然缺乏可靠的自动评估指标,导致人类评估成为黄金标准,这通常是昂贵的。为了解决现有评估方法的局限性,我们提出了一种新的自动评估方法,该方法采用微调的LLM来有效评估情景对话模型的性能。