Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models

本文提出了一种名为SEP的框架,利用自我反思代理和PPO,使大型语言模型(LLM)能自主生成可解释的股票预测。传统LLM在解释股票预测时面临挑战,但SEP解决了这一问题,无需人工注释的训练样本。实验证明,SEP框架在预测精度和解释质量上优于传统方法,并在投资组合构建任务中表现有效。未来工作将探讨如何提高生成响应的稳健性并利用多模态数据源增强预测能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Learning to Generate Explainable Stock Predictions using
Self Reflective Large Language Models》的翻译。

学习使用自反射大型语言模型生成可解释的股票预测

摘要

对于传统的非生成深度学习模型来说,解释股票预测通常是一项困难的任务,因为解释仅限于可视化重要文本的注意力权重。如今,大型语言模型(LLM)为这个问题提供了一种解决方案,因为它们具有为决策过程生成人类可读解释的已知能力。然而,股票预测的任务对LLM来说仍然具有挑战性,因为它需要能够权衡混乱的社会文本对股价的不同影响。随着解释部分的引入,这个问题变得越来越困难,这需要LLM口头解释为什么某些因素比其他因素更重要。另一方面,为了为这样的任务微调LLM,需要对训练集中的每个股票运动进行专家注释的解释样本,这是昂贵的,而且难以扩展。
为了解决这些问题,我们提出了我们的总结-解释-预测(SEP)框架,该框架利用了言语自我反思代理和近端策略优化(PPO),使LLM能够自学如何以完全自主的方式生成可解释的股票预测。反思代理通过自我推理过程学习如何解释过去的股票走势,而PPO训练师则训练模型在测试时根据输入文本生成最有可能的解释。PPO训练器的训练样本也是在反思过程中生成的响应,这消除了对人工注释器的需

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值