Befreiung des Rechts mit LOCUS: Ein Korpus lokaler Verordnungen für die Vereinigten Staaten
Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States
June 17, 2026
Autoren: Denis Peskoff, Joe Barrow, Christopher Vu, Diag Davenport
cs.AI
Zusammenfassung
Fortschritte in der Rechts-KI sind zunehmend auf den Zugang zu maßgeblichen Rechtstexten in großem Umfang angewiesen. Dennoch fehlt eine der folgenreichsten Ebenen des amerikanischen Rechts in bestehenden maschinenlesbaren Korpora weitgehend: kommunale Verordnungen. Lokale Satzungen regeln Bereiche wie Bebauungsplanung, Wohnungswesen, Gewerbelizenzen, öffentliche Gesundheit, Lärm, Tierkontrolle und viele andere alltägliche Regelungsdomänen, sind jedoch über Anbieterplattformen verstreut, die für die menschliche Durchsicht und nicht für den massenhaften Forschungszugriff konzipiert sind. Wir stellen LOCUS vor – das Korpus lokaler Verordnungen für die Vereinigten Staaten – ein umfassendes Korpus und eine auf County-Ebene harmonisierte Zugriffsschicht für US-amerikanische Gemeinde- und County-Satzungen. Das Rohkorpus, das für Forscher zur Freigabe vorgesehen ist, umfasst nahezu alle öffentlich zugänglichen Gemeinde- und County-Satzungen. Das resultierende Rohkorpus enthält Satzungen von 9.239 Städten und Countys. Eine kleinere, auf County-Ebene harmonisierte LOCUS-Zugriffsschicht deckt die größten 2.309 der 3.144 US-Countys ab, die einen Bevölkerungsmehrheit repräsentieren. Wir verwenden OCR, um die Vielzahl von Dokumentformaten zu bewältigen, die das Recht daran gehindert haben, eine öffentliche Ressource zu sein. Wir veröffentlichen das Korpus mit Abdeckungsmetadaten, um Reproduzierbarkeit, nachgelagerte Rechts-KI-Forschung und die schrittweise Erweiterung des maschinenlesbaren Zugangs zu lokalem Recht zu unterstützen. Wir trainieren eine Sammlung von auf ModernBERT basierenden Klassifikatoren und Scorern, um die Analyse von US-amerikanischem Lokalrecht in mehreren Dimensionen zu ermöglichen, darunter Opazität und Paternalismus, die zuvor in diesem Umfang nicht untersucht wurden. LOCUS-v1 und seine abgeleiteten Modelle sind verfügbar unter: https://huggingface.co/datasets/LocalLaws/LOCUS-v1
English
Progress in legal AI increasingly depends on access to authoritative legal text at scale. Yet one of the most consequential layers of American law remains largely absent from existing machine-readable corpora: local ordinances. Local codes govern zoning, housing, business licensing, public health, noise, animal control, and many other domains of everyday regulation, but they are fragmented across vendor platforms designed for human browsing rather than bulk research access. We introduce LOCUS - the Local Ordinance Corpus for the United States - a comprehensive corpus and county-harmonized access layer for U.S. municipal and county ordinance codes. The raw corpus, available for release to researchers, represents nearly all publicly available municipal and county ordinance codes. The resulting raw corpus contains codes from 9,239 cities and counties. A smaller county-harmonized LOCUS access layer provides coverage for the largest 2,309 of 3,144 U.S. counties, accounting for a majority of the population. We use OCR to handle the myriad of document formats that have kept the law from being a public resource. We release the corpus with coverage metadata to support reproducibility, downstream legal AI research, and the incremental expansion of machine-readable access to local law. We train a collection of ModernBERT-based classifiers and scorers to facilitate analyzing U.S. local law among several dimensions, such as opacity and paternalism, that have not previously been studied at this scale. LOCUS-v1 and its derivative models are available at: https://huggingface.co/datasets/LocalLaws/LOCUS-v1