Évaluation par les pairs académique pilotée par l'IA via l'incitation persistante des workflows, la méta-incitation et la méta-raisonnement

papers.abstract

L'examen critique par les pairs des manuscrits scientifiques représente un défi majeur pour les modèles de langage de grande envergure (LLMs), en partie en raison des limitations des données et de la complexité du raisonnement expert. Ce rapport présente le *Persistent Workflow Prompting* (PWP), une méthodologie de conception d'invites potentiellement largement applicable, conçue pour combler cette lacune en utilisant des interfaces de chat standard pour les LLMs (sans code, sans API). Nous présentons une preuve de concept d'une invite PWP pour l'analyse critique de manuscrits de chimie expérimentale, mettant en avant une architecture hiérarchique et modulaire (structurée via Markdown) qui définit des workflows d'analyse détaillés. Nous développons cette invite PWP grâce à une application itérative de techniques de méta-invites et de méta-raisonnement visant à systématiser les workflows d'examen expert, y compris les connaissances tacites. Soumise une seule fois au début d'une session, cette invite PWP équipe le LLM de workflows persistants déclenchés par des requêtes ultérieures, guidant les LLM modernes à travers des évaluations systématiques et multimodales. Les démonstrations montrent que le LLM guidé par PWP identifie des lacunes méthodologiques majeures dans un cas test tout en atténuant les biais d'entrée du LLM et en accomplissant des tâches complexes, notamment distinguer les affirmations des preuves, intégrer l'analyse de texte/photo/figure pour déduire des paramètres, exécuter des vérifications de faisabilité quantitative, comparer les estimations aux affirmations et évaluer la plausibilité a priori. Pour garantir la transparence et faciliter la réplication, nous fournissons les invites complètes, des analyses détaillées des démonstrations et des journaux de chats interactifs en tant que ressources supplémentaires. Au-delà de l'application spécifique, ce travail offre des insights sur le processus de méta-développement lui-même, mettant en lumière le potentiel du PWP, informé par une formalisation détaillée des workflows, pour permettre des analyses sophistiquées à l'aide de LLM facilement accessibles pour des tâches scientifiques complexes.

English

Critical peer review of scientific manuscripts presents a significant challenge for Large Language Models (LLMs), partly due to data limitations and the complexity of expert reasoning. This report introduces Persistent Workflow Prompting (PWP), a potentially broadly applicable prompt engineering methodology designed to bridge this gap using standard LLM chat interfaces (zero-code, no APIs). We present a proof-of-concept PWP prompt for the critical analysis of experimental chemistry manuscripts, featuring a hierarchical, modular architecture (structured via Markdown) that defines detailed analysis workflows. We develop this PWP prompt through iterative application of meta-prompting techniques and meta-reasoning aimed at systematically codifying expert review workflows, including tacit knowledge. Submitted once at the start of a session, this PWP prompt equips the LLM with persistent workflows triggered by subsequent queries, guiding modern reasoning LLMs through systematic, multimodal evaluations. Demonstrations show the PWP-guided LLM identifying major methodological flaws in a test case while mitigating LLM input bias and performing complex tasks, including distinguishing claims from evidence, integrating text/photo/figure analysis to infer parameters, executing quantitative feasibility checks, comparing estimates against claims, and assessing a priori plausibility. To ensure transparency and facilitate replication, we provide full prompts, detailed demonstration analyses, and logs of interactive chats as supplementary resources. Beyond the specific application, this work offers insights into the meta-development process itself, highlighting the potential of PWP, informed by detailed workflow formalization, to enable sophisticated analysis using readily available LLMs for complex scientific tasks.

Évaluation par les pairs académique pilotée par l'IA via l'incitation persistante des workflows, la méta-incitation et la méta-raisonnement

AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning

papers.abstract

Support