Rompiendo reCAPTCHAv2
Breaking reCAPTCHAv2
September 13, 2024
Autores: Andreas Plesner, Tobias Vontobel, Roger Wattenhofer
cs.AI
Resumen
Nuestro trabajo examina la eficacia de emplear métodos avanzados de aprendizaje automático para resolver captchas del sistema reCAPTCHAv2 de Google. Evaluamos la efectividad de los sistemas automatizados en resolver captchas mediante el uso de modelos YOLO avanzados para segmentación y clasificación de imágenes. Nuestro resultado principal es que podemos resolver el 100% de los captchas, mientras que trabajos anteriores solo resolvieron el 68-71%. Además, nuestros hallazgos sugieren que no hay una diferencia significativa en el número de desafíos que humanos y bots deben resolver para pasar los captchas en reCAPTCHAv2. Esto implica que las tecnologías de IA actuales pueden explotar captchas avanzados basados en imágenes. También analizamos en detalle reCAPTCHAv2 y encontramos evidencia de que reCAPTCHAv2 se basa en gran medida en datos de cookies e historial del navegador al evaluar si un usuario es humano o no. El código se proporciona junto con este documento.
English
Our work examines the efficacy of employing advanced machine learning methods
to solve captchas from Google's reCAPTCHAv2 system. We evaluate the
effectiveness of automated systems in solving captchas by utilizing advanced
YOLO models for image segmentation and classification. Our main result is that
we can solve 100% of the captchas, while previous work only solved 68-71%.
Furthermore, our findings suggest that there is no significant difference in
the number of challenges humans and bots must solve to pass the captchas in
reCAPTCHAv2. This implies that current AI technologies can exploit advanced
image-based captchas. We also look under the hood of reCAPTCHAv2, and find
evidence that reCAPTCHAv2 is heavily based on cookie and browser history data
when evaluating whether a user is human or not. The code is provided alongside
this paper.Summary
AI-Generated Summary