Direccionamiento de la Caché KV para Inducir Razonamiento en Modelos de Lenguaje Pequeños

Resumen

Proponemos la dirección de caché, un método ligero para la dirección implícita de modelos de lenguaje mediante una intervención de un solo paso aplicada directamente a la caché de clave-valor. Para validar su efectividad, aplicamos la dirección de caché para inducir razonamiento en cadena en modelos de lenguaje pequeños. Nuestro enfoque aprovecha trazas de razonamiento generadas por GPT-4o para construir vectores de dirección que modifican el comportamiento del modelo hacia un razonamiento más explícito y de múltiples pasos, sin necesidad de ajustes finos o modificaciones en las indicaciones. Las evaluaciones experimentales en diversos puntos de referencia de razonamiento demuestran que la dirección de caché mejora tanto la estructura cualitativa del razonamiento del modelo como el rendimiento cuantitativo en las tareas. En comparación con técnicas previas de dirección de activación que requieren intervenciones continuas, nuestra dirección de caché de un solo paso ofrece ventajas sustanciales en términos de estabilidad de hiperparámetros, eficiencia en tiempo de inferencia y facilidad de integración, convirtiéndola en una solución más robusta y práctica para la generación controlada.

English

We propose cache steering, a lightweight method for implicit steering of language models via a one-shot intervention applied directly to the key-value cache. To validate its effectiveness, we apply cache steering to induce chain-of-thought reasoning in small language models. Our approach leverages GPT-4o-generated reasoning traces to construct steering vectors that shift model behavior toward more explicit, multi-step reasoning without fine-tuning or prompt modifications. Experimental evaluations on diverse reasoning benchmarks demonstrate that cache steering improves both the qualitative structure of model reasoning and quantitative task performance. Compared to prior activation steering techniques that require continuous interventions, our one-shot cache steering offers substantial advantages in terms of hyperparameter stability, inference-time efficiency, and ease of integration, making it a more robust and practical solution for controlled generation.

Direccionamiento de la Caché KV para Inducir Razonamiento en Modelos de Lenguaje Pequeños

KV Cache Steering for Inducing Reasoning in Small Language Models

Resumen

Support