Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models

UnknownBody

已于 2024-05-13 11:00:15 修改

阅读量413

点赞数 3

于 2024-05-13 10:50:56 首次发布

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/138792163

版权

LLM Daily 同时被 2 个专栏收录

1201 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

LLM for finance

16 篇文章

订阅专栏

本文提出了一种名为SEP的框架，利用自我反思代理和PPO，使大型语言模型（LLM）能自主生成可解释的股票预测。传统LLM在解释股票预测时面临挑战，但SEP解决了这一问题，无需人工注释的训练样本。实验证明，SEP框架在预测精度和解释质量上优于传统方法，并在投资组合构建任务中表现有效。未来工作将探讨如何提高生成响应的稳健性并利用多模态数据源增强预测能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文是LLM系列文章，针对《Learning to Generate Explainable Stock Predictions using
Self Reflective Large Language Models》的翻译。

摘要

对于传统的非生成深度学习模型来说，解释股票预测通常是一项困难的任务，因为解释仅限于可视化重要文本的注意力权重。如今，大型语言模型（LLM）为这个问题提供了一种解决方案，因为它们具有为决策过程生成人类可读解释的已知能力。然而，股票预测的任务对LLM来说仍然具有挑战性，因为它需要能够权衡混乱的社会文本对股价的不同影响。随着解释部分的引入，这个问题变得越来越困难，这需要LLM口头解释为什么某些因素比其他因素更重要。另一方面，为了为这样的任务微调LLM，需要对训练集中的每个股票运动进行专家注释的解释样本，这是昂贵的，而且难以扩展。
为了解决这些问题，我们提出了我们的总结-解释-预测（SEP）框架，该框架利用了言语自我反思代理和近端策略优化（PPO），使LLM能够自学如何以完全自主的方式生成可解释的股票预测。反思代理通过自我推理过程学习如何解释过去的股票走势，而PPO训练师则训练模型在测试时根据输入文本生成最有可能的解释。PPO训练器的训练样本也是在反思过程中生成的响应，这消除了对人工注释器的需