MisSynth: Mejora de la Clasificación de Falacias Lógicas MISSCI mediante Datos Sintéticos

Resumen

La información errónea relacionada con la salud es muy prevalente y potencialmente dañina. Es difícil de identificar, especialmente cuando las afirmaciones distorsionan o interpretan erróneamente hallazgos científicos. Investigamos el impacto de la generación de datos sintéticos y las técnicas de ajuste fino de bajo costo en la capacidad de los modelos de lenguaje grandes (LLMs) para reconocer argumentos falaces utilizando el conjunto de datos y el marco MISSCI. En este trabajo, proponemos MisSynth, un pipeline que aplica la generación aumentada por recuperación (RAG) para producir muestras sintéticas de falacias, las cuales se utilizan luego para ajustar un modelo LLM. Nuestros resultados muestran ganancias sustanciales en precisión con los modelos ajustados en comparación con los modelos base. Por ejemplo, el modelo LLaMA 3.1 8B ajustado logró una mejora absoluta de más del 35% en la puntuación F1 en la división de prueba de MISSCI sobre su versión base. Demostramos que la introducción de datos de falacias sintéticas para aumentar los recursos anotados limitados puede mejorar significativamente el rendimiento de clasificación zero-shot de los LLMs en tareas de información errónea científica del mundo real, incluso con recursos computacionales limitados. El código y el conjunto de datos sintéticos están disponibles en https://github.com/mxpoliakov/MisSynth.

English

Health-related misinformation is very prevalent and potentially harmful. It is difficult to identify, especially when claims distort or misinterpret scientific findings. We investigate the impact of synthetic data generation and lightweight fine-tuning techniques on the ability of large language models (LLMs) to recognize fallacious arguments using the MISSCI dataset and framework. In this work, we propose MisSynth, a pipeline that applies retrieval-augmented generation (RAG) to produce synthetic fallacy samples, which are then used to fine-tune an LLM model. Our results show substantial accuracy gains with fine-tuned models compared to vanilla baselines. For instance, the LLaMA 3.1 8B fine-tuned model achieved an over 35% F1-score absolute improvement on the MISSCI test split over its vanilla baseline. We demonstrate that introducing synthetic fallacy data to augment limited annotated resources can significantly enhance zero-shot LLM classification performance on real-world scientific misinformation tasks, even with limited computational resources. The code and synthetic dataset are available on https://github.com/mxpoliakov/MisSynth.

MisSynth: Mejora de la Clasificación de Falacias Lógicas MISSCI mediante Datos Sintéticos

MisSynth: Improving MISSCI Logical Fallacies Classification with Synthetic Data

Resumen

Support