ChatPaper.aiChatPaper

Liberando la ley con LOCUS: Un corpus de ordenanzas locales para los Estados Unidos

Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States

June 17, 2026
Autores: Denis Peskoff, Joe Barrow, Christopher Vu, Diag Davenport
cs.AI

Resumen

El progreso en la inteligencia artificial jurídica depende cada vez más del acceso a textos legales autoritativos a gran escala. Sin embargo, uno de los niveles más relevantes del derecho estadounidense sigue estando prácticamente ausente en los corpus digitales existentes: las ordenanzas locales. Los códigos locales regulan el zonificación, la vivienda, las licencias comerciales, la salud pública, el ruido, el control animal y muchos otros ámbitos de la regulación cotidiana, pero se encuentran fragmentados en plataformas de proveedores diseñadas para la navegación humana y no para el acceso masivo a la investigación. Presentamos LOCUS (Local Ordinance Corpus for the United States, por sus siglas en inglés), un corpus integral y una capa de acceso armonizada a nivel de condado para los códigos de ordenanzas municipales y de condado de Estados Unidos. El corpus bruto, disponible para su publicación a investigadores, representa prácticamente todos los códigos de ordenanzas municipales y de condado de acceso público. El corpus bruto resultante contiene códigos de 9.239 ciudades y condados. Una capa de acceso LOCUS más reducida, armonizada a nivel de condado, proporciona cobertura para los 2.309 condados más grandes de los 3.144 de Estados Unidos, que concentran la mayor parte de la población. Utilizamos OCR para procesar la miríada de formatos documentales que han impedido que la ley sea un recurso público. Publicamos el corpus con metadatos de cobertura para apoyar la reproducibilidad, la investigación posterior en inteligencia artificial jurídica y la expansión incremental del acceso legible por máquina al derecho local. Entrenamos un conjunto de clasificadores y puntuadores basados en ModernBERT para facilitar el análisis del derecho local estadounidense en varias dimensiones, como la opacidad y el paternalismo, que no se habían estudiado previamente a esta escala. LOCUS-v1 y sus modelos derivados están disponibles en: https://huggingface.co/datasets/LocalLaws/LOCUS-v1
English
Progress in legal AI increasingly depends on access to authoritative legal text at scale. Yet one of the most consequential layers of American law remains largely absent from existing machine-readable corpora: local ordinances. Local codes govern zoning, housing, business licensing, public health, noise, animal control, and many other domains of everyday regulation, but they are fragmented across vendor platforms designed for human browsing rather than bulk research access. We introduce LOCUS - the Local Ordinance Corpus for the United States - a comprehensive corpus and county-harmonized access layer for U.S. municipal and county ordinance codes. The raw corpus, available for release to researchers, represents nearly all publicly available municipal and county ordinance codes. The resulting raw corpus contains codes from 9,239 cities and counties. A smaller county-harmonized LOCUS access layer provides coverage for the largest 2,309 of 3,144 U.S. counties, accounting for a majority of the population. We use OCR to handle the myriad of document formats that have kept the law from being a public resource. We release the corpus with coverage metadata to support reproducibility, downstream legal AI research, and the incremental expansion of machine-readable access to local law. We train a collection of ModernBERT-based classifiers and scorers to facilitate analyzing U.S. local law among several dimensions, such as opacity and paternalism, that have not previously been studied at this scale. LOCUS-v1 and its derivative models are available at: https://huggingface.co/datasets/LocalLaws/LOCUS-v1