CoIn: Contando los tokens de razonamiento invisibles en las API opacas de LLM comerciales

Resumen

A medida que las técnicas de posentrenamiento evolucionan, los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) están siendo cada vez más potenciados con capacidades estructuradas de razonamiento de múltiples pasos, frecuentemente optimizadas mediante aprendizaje por refuerzo. Estos modelos mejorados con razonamiento superan a los LLMs estándar en tareas complejas y ahora respaldan muchas APIs comerciales de LLMs. Sin embargo, para proteger comportamientos propietarios y reducir la verbosidad, los proveedores suelen ocultar los rastros de razonamiento, devolviendo únicamente la respuesta final. Esta opacidad introduce una brecha crítica de transparencia: los usuarios son facturados por tokens de razonamiento invisibles, que a menudo representan la mayor parte del costo, pero no tienen medios para verificar su autenticidad. Esto abre la puerta a la inflación en el conteo de tokens, donde los proveedores podrían reportar de más el uso de tokens o inyectar tokens sintéticos de bajo esfuerzo para inflar los cargos. Para abordar este problema, proponemos CoIn, un marco de verificación que audita tanto la cantidad como la validez semántica de los tokens ocultos. CoIn construye un árbol de hash verificable a partir de huellas digitales de incrustaciones de tokens para verificar los conteos de tokens, y utiliza coincidencias de relevancia basadas en incrustaciones para detectar contenido de razonamiento fabricado. Los experimentos demuestran que CoIn, cuando se implementa como un auditor de terceros confiable, puede detectar eficazmente la inflación en el conteo de tokens con una tasa de éxito de hasta el 94.7%, mostrando una fuerte capacidad para restaurar la transparencia en la facturación de servicios opacos de LLMs. El conjunto de datos y el código están disponibles en https://github.com/CASE-Lab-UMD/LLM-Auditing-CoIn.

English

As post-training techniques evolve, large language models (LLMs) are increasingly augmented with structured multi-step reasoning abilities, often optimized through reinforcement learning. These reasoning-enhanced models outperform standard LLMs on complex tasks and now underpin many commercial LLM APIs. However, to protect proprietary behavior and reduce verbosity, providers typically conceal the reasoning traces while returning only the final answer. This opacity introduces a critical transparency gap: users are billed for invisible reasoning tokens, which often account for the majority of the cost, yet have no means to verify their authenticity. This opens the door to token count inflation, where providers may overreport token usage or inject synthetic, low-effort tokens to inflate charges. To address this issue, we propose CoIn, a verification framework that audits both the quantity and semantic validity of hidden tokens. CoIn constructs a verifiable hash tree from token embedding fingerprints to check token counts, and uses embedding-based relevance matching to detect fabricated reasoning content. Experiments demonstrate that CoIn, when deployed as a trusted third-party auditor, can effectively detect token count inflation with a success rate reaching up to 94.7%, showing the strong ability to restore billing transparency in opaque LLM services. The dataset and code are available at https://github.com/CASE-Lab-UMD/LLM-Auditing-CoIn.

CoIn: Contando los tokens de razonamiento invisibles en las API opacas de LLM comerciales

CoIn: Counting the Invisible Reasoning Tokens in Commercial Opaque LLM APIs

Resumen

Support