FeRG-LLM : Feature Engineering by Reason Generation Large Language Models

在这里插入图片描述

文章主要内容

  1. 研究背景:在表格数据的机器学习任务中,特征工程至关重要,但需要大量人力和专业知识。虽然大语言模型在特征工程领域有所应用,但现有方法存在依赖云托管大语言模型(如GPT)、仅适用于分类任务、难以处理大规模数据和安全问题等局限性。
  2. 相关工作:介绍了其他基于语言模型的特征工程研究(如CAAFE、FeatLLM),对比了它们与FeRG - LLM的能力差异;同时阐述了思维链(Chain - of - Thought,CoT)和直接偏好优化(Direct Preference Optimization,DPO)的相关理论,为FeRG - LLM框架提供理论基础。
  3. 方法:构建两阶段对话数据集,利用GPT - 4omini API提取信息,通过重新格式化信息激发8B规模语言模型的CoT推理能力,第一阶段生成新特征的关键思路,第二阶段生成Python代码实现特征创建,并利用LoRA进行监督微调;使用DPO对生成特征的合理性进行
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值