SaulLM-54B e SaulLM-141B: Ampliando a Adaptação de Domínio para o Domínio LegalSaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal
Domain
Neste artigo, apresentamos o SaulLM-54B e o SaulLM-141B, dois grandes modelos de linguagem (LLMs) desenvolvidos para o setor jurídico. Esses modelos, com arquiteturas de 54 bilhões e 141 bilhões de parâmetros, respectivamente, são baseados na arquitetura Mixtral. O desenvolvimento do SaulLM-54B e do SaulLM-141B é orientado pela adaptação de domínio em larga escala, dividida em três estratégias: (1) a exploração de pré-treinamento contínuo envolvendo um corpus base que inclui mais de 540 bilhões de tokens legais, (2) a implementação de um protocolo especializado de seguimento de instruções legais e (3) o alinhamento das saídas do modelo com as preferências humanas em interpretações legais. A integração de dados gerados sinteticamente nos segundo e terceiro passos aprimora as capacidades dos modelos em interpretar e processar textos legais, alcançando efetivamente um desempenho de ponta e superando modelos de código aberto anteriores no LegalBench-Instruct. Este trabalho explora os compromissos envolvidos na adaptação específica de domínio nessa escala, oferecendo insights que podem informar estudos futuros sobre adaptação de domínio usando modelos decodificadores robustos. Construindo sobre o SaulLM-7B, este estudo aprimora a abordagem para produzir um LLM mais bem equipado para tarefas jurídicas. Estamos disponibilizando versões base, de instrução e alinhadas sobre o SaulLM-54B e o SaulLM-141B sob a Licença MIT para facilitar a reutilização e a pesquisa colaborativa.