ChatGLM: Eine Familie großer Sprachmodelle von GLM-130B bis GLM-4 Alle Tools

Zusammenfassung

Wir stellen ChatGLM vor, eine sich entwickelnde Familie großer Sprachmodelle, an der wir im Laufe der Zeit gearbeitet haben. Dieser Bericht konzentriert sich hauptsächlich auf die GLM-4-Sprachserie, zu der GLM-4, GLM-4-Air und GLM-4-9B gehören. Sie repräsentieren unsere leistungsfähigsten Modelle, die mit allen Erkenntnissen und Lehren trainiert wurden, die aus den vorangegangenen drei Generationen von ChatGLM gewonnen wurden. Bisher wurden die GLM-4-Modelle auf zehn Billionen Tokens hauptsächlich in Chinesisch und Englisch vorab trainiert, zusammen mit einem kleinen Korpus aus 24 Sprachen, hauptsächlich für den Gebrauch in Chinesisch und Englisch. Die hochwertige Ausrichtung wird durch einen mehrstufigen Nachschulungsprozess erreicht, der überwachtes Feintuning und das Lernen aus menschlichem Feedback beinhaltet. Bewertungen zeigen, dass GLM-4 1) GPT-4 in Bezug auf allgemeine Metriken wie MMLU, GSM8K, MATH, BBH, GPQA und HumanEval nahezu ebenbürtig ist oder übertrifft, 2) in der Anweisungsbefolgung GPT-4-Turbo nahekommt, wie durch IFEval gemessen, 3) GPT-4 Turbo (128K) und Claude 3 für Aufgaben mit langem Kontext ebenbürtig ist und 4) GPT-4 in chinesischen Ausrichtungen, wie durch AlignBench gemessen, übertrifft. Das GLM-4 All Tools-Modell ist zusätzlich darauf ausgerichtet, Benutzerabsichten zu verstehen und autonom zu entscheiden, wann und welche Werkzeuge - einschließlich Webbrowser, Python-Interpreter, Text-zu-Bild-Modell und benutzerdefinierte Funktionen - effektiv zur Bewältigung komplexer Aufgaben eingesetzt werden sollen. In praktischen Anwendungen ist es in der Lage, und übertrifft sogar GPT-4 All Tools bei Aufgaben wie dem Zugriff auf Online-Informationen über Web-Browsing und dem Lösen von mathematischen Problemen mit dem Python-Interpreter. Im Laufe der Zeit haben wir eine Reihe von Modellen als Open-Source veröffentlicht, darunter ChatGLM-6B (drei Generationen), GLM-4-9B (128K, 1M), GLM-4V-9B, WebGLM und CodeGeeX, die allein im Jahr 2023 über 10 Millionen Downloads auf Hugging Face angezogen haben. Die Open-Source-Modelle können über https://github.com/THUDM und https://huggingface.co/THUDM abgerufen werden.

English

We introduce ChatGLM, an evolving family of large language models that we have been developing over time. This report primarily focuses on the GLM-4 language series, which includes GLM-4, GLM-4-Air, and GLM-4-9B. They represent our most capable models that are trained with all the insights and lessons gained from the preceding three generations of ChatGLM. To date, the GLM-4 models are pre-trained on ten trillions of tokens mostly in Chinese and English, along with a small set of corpus from 24 languages, and aligned primarily for Chinese and English usage. The high-quality alignment is achieved via a multi-stage post-training process, which involves supervised fine-tuning and learning from human feedback. Evaluations show that GLM-4 1) closely rivals or outperforms GPT-4 in terms of general metrics such as MMLU, GSM8K, MATH, BBH, GPQA, and HumanEval, 2) gets close to GPT-4-Turbo in instruction following as measured by IFEval, 3) matches GPT-4 Turbo (128K) and Claude 3 for long context tasks, and 4) outperforms GPT-4 in Chinese alignments as measured by AlignBench. The GLM-4 All Tools model is further aligned to understand user intent and autonomously decide when and which tool(s) touse -- including web browser, Python interpreter, text-to-image model, and user-defined functions -- to effectively complete complex tasks. In practical applications, it matches and even surpasses GPT-4 All Tools in tasks like accessing online information via web browsing and solving math problems using Python interpreter. Over the course, we have open-sourced a series of models, including ChatGLM-6B (three generations), GLM-4-9B (128K, 1M), GLM-4V-9B, WebGLM, and CodeGeeX, attracting over 10 million downloads on Hugging face in the year 2023 alone. The open models can be accessed through https://github.com/THUDM and https://huggingface.co/THUDM.

ChatGLM: Eine Familie großer Sprachmodelle von GLM-130B bis GLM-4 Alle Tools

ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools

Zusammenfassung

Support