
LLM Data
文章平均质量分 62
UnknownBody
AI博士,最近一直follow大模型相关论文,每日会更新学术界论文的进展。
展开
-
ROBUSTFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response
监督微调(SFT)在使大型语言模型(LLM)适应特定领域或任务方面起着至关重要的作用。然而,正如实证实验所证明的那样,在实际应用中,收集的数据不可避免地包含噪声,这对下游任务的模型性能提出了重大挑战。因此,迫切需要一个抗噪声的SFT框架来增强下游任务中的模型能力。为了应对这一挑战,我们引入了一个鲁棒的SFT框架(ROBUSFT),该框架对下游任务数据进行噪声检测和重新标记。对于噪声识别,我们的方法采用具有推理增强模型的多专家协作系统来实现卓越的噪声检测。原创 2025-01-16 10:15:00 · 155 阅读 · 0 评论 -
ResoFilter: Fine-grained Synthetic Data Filtering for Large Language Models through Data-Parameter
大型语言模型(LLM)在各个领域都表现出了显著的有效性,利用GPT生成合成数据的数据增强方法变得越来越普遍。然而,增强数据的质量和效用仍然值得怀疑,目前的方法缺乏评估数据特征的明确指标。为了应对这些挑战,我们提出了ResoFilter,这是一种整合模型、数据和任务以优化数据集的新方法。ResoFilter利用微调过程来获取数据参数特征以进行数据选择,通过模型权重表示数据特征来提高可解释性。原创 2025-01-16 09:15:00 · 440 阅读 · 0 评论