PokemonChat: Auditoria do ChatGPT sobre Conhecimento do Universo Pokémon
PokemonChat: Auditing ChatGPT for Pokémon Universe Knowledge
June 5, 2023
Autores: Laura Cabello, Jiaang Li, Ilias Chalkidis
cs.AI
Resumo
O modelo ChatGPT, recentemente lançado, demonstra capacidades sem precedentes em tarefas de questionamento e resposta em cenários de zero-shot. Neste trabalho, investigamos o ChatGPT quanto à sua compreensão conversacional e introduzimos um framework (protocolo) conversacional que pode ser adotado em estudos futuros. O universo Pokémon serve como um terreno ideal para auditar as capacidades de raciocínio do ChatGPT devido à sua suposição de mundo fechado. Após revelar o conhecimento prévio do ChatGPT sobre o universo Pokémon, testamos seu processo de raciocínio ao utilizar esses conceitos em cenários de batalha. Em seguida, avaliamos sua capacidade de adquirir novos conhecimentos e incorporá-los em seu processo de raciocínio. Nosso objetivo final é avaliar a capacidade do ChatGPT de generalizar, combinar características e adquirir e raciocinar sobre novos conhecimentos introduzidos a partir de feedback humano. Descobrimos que o ChatGPT possui conhecimento prévio do universo Pokémon, sobre o qual consegue raciocinar em cenários de batalha em grande medida, mesmo quando novas informações são introduzidas. O modelo apresenta melhor desempenho com feedback colaborativo e se houver uma fase inicial de recuperação de informações, mas também alucina ocasionalmente e é suscetível a ataques adversariais.
English
The recently released ChatGPT model demonstrates unprecedented capabilities
in zero-shot question-answering. In this work, we probe ChatGPT for its
conversational understanding and introduce a conversational framework
(protocol) that can be adopted in future studies. The Pok\'emon universe serves
as an ideal testing ground for auditing ChatGPT's reasoning capabilities due to
its closed world assumption. After bringing ChatGPT's background knowledge (on
the Pok\'emon universe) to light, we test its reasoning process when using
these concepts in battle scenarios. We then evaluate its ability to acquire new
knowledge and include it in its reasoning process. Our ultimate goal is to
assess ChatGPT's ability to generalize, combine features, and to acquire and
reason over newly introduced knowledge from human feedback. We find that
ChatGPT has prior knowledge of the Pokemon universe, which can reason upon in
battle scenarios to a great extent, even when new information is introduced.
The model performs better with collaborative feedback and if there is an
initial phase of information retrieval, but also hallucinates occasionally and
is susceptible to adversarial attacks.