ChatPaper.aiChatPaper

Rapport technique Pegasus-v1

Pegasus-v1 Technical Report

April 23, 2024
Auteurs: Raehyuk Jung, Hyojun Go, Jaehyuk Yi, Jiho Jang, Daniel Kim, Jay Suh, Aiden Lee, Cooper Han, Jae Lee, Jeff Kim, Jin-Young Kim, Junwan Kim, Kyle Park, Lucas Lee, Mars Ha, Minjoon Seo, Abraham Jo, Ed Park, Hassan Kianinejad, SJ Kim, Tony Moon, Wade Jeong, Andrei Popescu, Esther Kim, EK Yoon, Genie Heo, Henry Choi, Jenna Kang, Kevin Han, Noah Seo, Sunny Nguyen, Ryan Won, Yeonhoo Park, Anthony Giuliani, Dave Chung, Hans Yoon, James Le, Jenny Ahn, June Lee, Maninder Saini, Meredith Sanders, Soyoung Lee, Sue Kim, Travis Couture
cs.AI

Résumé

Ce rapport technique présente Pegasus-1, un modèle de langage multimodal spécialisé dans la compréhension et l'interaction avec des contenus vidéo via le langage naturel. Pegasus-1 est conçu pour relever les défis spécifiques posés par les données vidéo, tels que l'interprétation des informations spatio-temporelles, afin d'offrir une compréhension nuancée des contenus vidéo de différentes durées. Ce rapport technique donne un aperçu de l'architecture de Pegasus-1, de ses stratégies d'entraînement et de ses performances sur des benchmarks de conversation vidéo, de question-réponse vidéo en zero-shot et de résumé vidéo. Nous explorons également les caractéristiques qualitatives de Pegasus-1, en démontrant ses capacités ainsi que ses limites, afin de fournir aux lecteurs une vision équilibrée de son état actuel et de ses perspectives d'évolution.
English
This technical report introduces Pegasus-1, a multimodal language model specialized in video content understanding and interaction through natural language. Pegasus-1 is designed to address the unique challenges posed by video data, such as interpreting spatiotemporal information, to offer nuanced video content comprehension across various lengths. This technical report overviews Pegasus-1's architecture, training strategies, and its performance in benchmarks on video conversation, zero-shot video question answering, and video summarization. We also explore qualitative characteristics of Pegasus-1 , demonstrating its capabilities as well as its limitations, in order to provide readers a balanced view of its current state and its future direction.

Summary

AI-Generated Summary

PDF332December 15, 2024