ChatPaper.aiChatPaper

Des instructions bien fondées sont tout ce dont vous avez besoin pour interroger LLaMA-1/2 et GPT-3.5/4.

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

December 26, 2023
Auteurs: Sondos Mahmoud Bsharat, Aidar Myrzakhan, Zhiqiang Shen
cs.AI

Résumé

Cet article présente 26 principes directeurs conçus pour rationaliser le processus d'interrogation et de formulation de requêtes pour les grands modèles de langage. Notre objectif est de simplifier les concepts fondamentaux liés à la formulation de questions pour différentes échelles de grands modèles de langage, d'examiner leurs capacités, et d'améliorer la compréhension des utilisateurs concernant les comportements de ces modèles à différentes échelles lorsqu'ils sont alimentés par différentes requêtes. Des expériences approfondies sont menées sur LLaMA-1/2 (7B, 13B et 70B) ainsi que sur GPT-3.5/4 pour vérifier l'efficacité des principes proposés dans la conception d'instructions et de requêtes. Nous espérons que ce travail fournira un meilleur guide pour les chercheurs travaillant sur la formulation de requêtes pour les grands modèles de langage. La page du projet est disponible à l'adresse suivante : https://github.com/VILA-Lab/ATLAS.
English
This paper introduces 26 guiding principles designed to streamline the process of querying and prompting large language models. Our goal is to simplify the underlying concepts of formulating questions for various scales of large language models, examining their abilities, and enhancing user comprehension on the behaviors of different scales of large language models when feeding into different prompts. Extensive experiments are conducted on LLaMA-1/2 (7B, 13B and 70B), GPT-3.5/4 to verify the effectiveness of the proposed principles on instructions and prompts design. We hope that this work provides a better guide for researchers working on the prompting of large language models. Project page is available at https://github.com/VILA-Lab/ATLAS.
PDF374December 15, 2024