Fino1: Zur Übertragbarkeit von Reasoning Enhanced LLMs auf FinanzenFino1: On the Transferability of Reasoning Enhanced LLMs to Finance
Die jüngsten Fortschritte bei großen Sprachmodellen (LLMs) haben starke allgemeine Argumentationsfähigkeiten gezeigt, aber ihre Wirksamkeit bei finanzieller Argumentation bleibt untererforscht. In dieser Studie bewerten wir umfassend 16 leistungsstarke Argumentations- und allgemeine LLMs in drei komplexen finanziellen Aufgaben, die finanziellen Text, tabellarische Daten und Gleichungen umfassen. Dabei bewerten wir numerische Argumentation, tabellarische Interpretation, das Verständnis finanzieller Terminologie, die Verarbeitung langer Kontexte und die Lösung von Gleichungsproblemen. Unsere Ergebnisse zeigen, dass bessere Datensätze und Vortrainieren die finanzielle Argumentation verbessern, allgemeine Verbesserungen wie CoT Feinabstimmung jedoch nicht immer konsistente Gewinne bringen. Darüber hinaus haben alle Argumentationsstrategien Schwierigkeiten, die Leistung bei langen Kontexten und Aufgaben mit mehreren Tabellen zu verbessern. Um diese Einschränkungen zu adressieren, entwickeln wir ein finanzargumentationsverbessertes Modell basierend auf Llama-3.1-8B-Instruct, durch CoT Feinabstimmung und Verstärkungslernen mit domänenspezifischen Argumentationspfaden. Selbst mit einfacher Feinabstimmung mit einem finanziellen Datensatz erzielt unser Modell eine konsistente Leistungssteigerung von 10 % über alle Aufgaben hinweg, und übertrifft alle 8B-Modelle und sogar Llama3-70B-Instruct und Llama3.1-70B-Instruct im Durchschnitt. Unsere Ergebnisse unterstreichen die Notwendigkeit domänenspezifischer Anpassungen bei finanziellen Aufgaben und betonen zukünftige Richtungen wie die Argumentation mit mehreren Tabellen, die Verarbeitung langer Kontexte und das Verständnis finanzieller Terminologie. Alle unsere Datensätze, Modelle und Codes sind öffentlich verfügbar. Darüber hinaus führen wir eine Bestenliste zur Benchmarking zukünftiger Datensätze und Modelle ein.