Fino1:论推理增强LLM在金融领域的可迁移性Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance
最近大型语言模型(LLMs)的进展展示出强大的一般推理能力,然而它们在金融推理方面的有效性尚未得到充分探讨。在本研究中,我们全面评估了16个强大的推理和通用LLMs在涉及金融文本、表格数据和方程的三个复杂金融任务上的表现,评估了数字推理、表格解释、金融术语理解、长文本处理和基于方程的问题解决能力。我们的结果表明,尽管更好的数据集和预训练可以改善金融推理,但像CoT微调这样的通用增强并不总是带来一致的收益。此外,所有推理策略在提高长文本和多表任务的性能方面都面临挑战。为了解决这些限制,我们基于Llama-3.1-8B-Instruct开发了一个金融推理增强模型,通过CoT微调和强化学习与特定领域推理路径相结合。即使只是对一个金融数据集进行简单微调,我们的模型在各项任务上都实现了一致的10%性能提升,超越了所有8B模型,甚至在平均水平上超过了Llama3-70B-Instruct和Llama3.1-70B-Instruct。我们的结果突显了金融任务中领域特定适应性的必要性,强调未来方向,如多表推理、长文本处理和金融术语理解。我们所有的数据集、模型和代码都是公开可用的。此外,我们引入了一个用于基准测试未来数据集和模型的排行榜。