Relatório Técnico do BitNet b1.58 2B4TBitNet b1.58 2B4T Technical Report
Apresentamos o BitNet b1.58 2B4T, o primeiro modelo de linguagem de grande escala (LLM) nativo de 1 bit e de código aberto na escala de 2 bilhões de parâmetros. Treinado em um corpus de 4 trilhões de tokens, o modelo foi rigorosamente avaliado em benchmarks que abrangem compreensão de linguagem, raciocínio matemático, proficiência em codificação e habilidade conversacional. Nossos resultados demonstram que o BitNet b1.58 2B4T alcança desempenho equivalente aos principais LLMs de precisão completa e pesos abertos de tamanho similar, ao mesmo tempo que oferece vantagens significativas em eficiência computacional, incluindo uma pegada de memória substancialmente reduzida, menor consumo de energia e latência de decodificação. Para facilitar pesquisas futuras e adoção, os pesos do modelo são disponibilizados via Hugging Face, juntamente com implementações de inferência de código aberto para arquiteturas de GPU e CPU.