ChatGLM: Uma Família de Modelos de Linguagem de Grande Escala, do GLM-130B ao GLM-4 All Tools

Resumo

Apresentamos o ChatGLM, uma família em evolução de modelos de linguagem de grande escala que temos desenvolvido ao longo do tempo. Este relatório concentra-se principalmente na série de linguagem GLM-4, que inclui GLM-4, GLM-4-Air e GLM-4-9B. Eles representam nossos modelos mais capazes, treinados com todos os insights e lições obtidos das três gerações anteriores do ChatGLM. Até o momento, os modelos GLM-4 foram pré-treinados em dez trilhões de tokens, principalmente em chinês e inglês, juntamente com um pequeno conjunto de corpus de 24 idiomas, e alinhados principalmente para uso em chinês e inglês. O alinhamento de alta qualidade é alcançado por meio de um processo de pós-treinamento em múltiplas etapas, que envolve ajuste fino supervisionado e aprendizado a partir de feedback humano. As avaliações mostram que o GLM-4 1) rivaliza de perto ou supera o GPT-4 em termos de métricas gerais como MMLU, GSM8K, MATH, BBH, GPQA e HumanEval, 2) se aproxima do GPT-4-Turbo na capacidade de seguir instruções, conforme medido pelo IFEval, 3) iguala o GPT-4 Turbo (128K) e o Claude 3 em tarefas de contexto longo, e 4) supera o GPT-4 em alinhamentos de chinês, conforme medido pelo AlignBench. O modelo GLM-4 All Tools é ainda mais alinhado para compreender a intenção do usuário e decidir autonomamente quando e quais ferramentas usar — incluindo navegador web, interpretador Python, modelo de texto para imagem e funções definidas pelo usuário — para concluir tarefas complexas de forma eficaz. Em aplicações práticas, ele iguala e até supera o GPT-4 All Tools em tarefas como acessar informações online por meio de navegação na web e resolver problemas matemáticos usando o interpretador Python. Ao longo do processo, disponibilizamos uma série de modelos em código aberto, incluindo ChatGLM-6B (três gerações), GLM-4-9B (128K, 1M), GLM-4V-9B, WebGLM e CodeGeeX, atraindo mais de 10 milhões de downloads no Hugging Face apenas no ano de 2023. Os modelos abertos podem ser acessados através de https://github.com/THUDM e https://huggingface.co/THUDM.

English

We introduce ChatGLM, an evolving family of large language models that we have been developing over time. This report primarily focuses on the GLM-4 language series, which includes GLM-4, GLM-4-Air, and GLM-4-9B. They represent our most capable models that are trained with all the insights and lessons gained from the preceding three generations of ChatGLM. To date, the GLM-4 models are pre-trained on ten trillions of tokens mostly in Chinese and English, along with a small set of corpus from 24 languages, and aligned primarily for Chinese and English usage. The high-quality alignment is achieved via a multi-stage post-training process, which involves supervised fine-tuning and learning from human feedback. Evaluations show that GLM-4 1) closely rivals or outperforms GPT-4 in terms of general metrics such as MMLU, GSM8K, MATH, BBH, GPQA, and HumanEval, 2) gets close to GPT-4-Turbo in instruction following as measured by IFEval, 3) matches GPT-4 Turbo (128K) and Claude 3 for long context tasks, and 4) outperforms GPT-4 in Chinese alignments as measured by AlignBench. The GLM-4 All Tools model is further aligned to understand user intent and autonomously decide when and which tool(s) touse -- including web browser, Python interpreter, text-to-image model, and user-defined functions -- to effectively complete complex tasks. In practical applications, it matches and even surpasses GPT-4 All Tools in tasks like accessing online information via web browsing and solving math problems using Python interpreter. Over the course, we have open-sourced a series of models, including ChatGLM-6B (three generations), GLM-4-9B (128K, 1M), GLM-4V-9B, WebGLM, and CodeGeeX, attracting over 10 million downloads on Hugging face in the year 2023 alone. The open models can be accessed through https://github.com/THUDM and https://huggingface.co/THUDM.

ChatGLM: Uma Família de Modelos de Linguagem de Grande Escala, do GLM-130B ao GLM-4 All Tools

ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools

Resumo

Support