ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
November 21st, 2024
SymDPO: Impulsando el Aprendizaje en Contexto de Modelos Multimodales Grandes con Optimización de Preferencia Directa de Demostración de Símbolos
SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization
Hongrui Jia, Chaoya Jiang, Haiyang Xu, Wei Ye, Mengfan Dong, Ming Yan, Ji Zhang, Fei Huang, Shikun Zhang
•
Nov 17, 2024
•
11
3
Informe Técnico SageAttention2: Atención precisa de 4 bits para aceleración de inferencia plug-and-play.
SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration
Jintao Zhang, Haofeng Huang, Pengle Zhang, Jia Wei, Jun Zhu, Jianfei Chen
•
Nov 17, 2024
•
56
9
VBench++: Suite de Evaluación Integral y Versátil para Modelos Generativos de Video
VBench++: Comprehensive and Versatile Benchmark Suite for Video Generative Models
Ziqi Huang, Fan Zhang, Xiaojie Xu, Yinan He, Jiashuo Yu, Ziyue Dong, Qianli Ma, Nattapol Chanpaisit, Chenyang Si, Yuming Jiang, Yaohui Wang, Xinyuan Chen, Ying-Cong Chen, Limin Wang, Dahua Lin, Yu Qiao, Ziwei Liu
•
Nov 20, 2024
•
35
3
VideoAutoArena: Una Arena Automatizada para Evaluar Modelos Multimodales Grandes en el Análisis de Video a través de la Simulación de Usuario
VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation
Ziyang Luo, Haoning Wu, Dongxu Li, Jing Ma, Mohan Kankanhalli, Junnan Li
•
Nov 20, 2024
•
22
5
SAMURAI: Adaptación del Modelo Segment Anything para el Seguimiento Visual Zero-Shot con Memoria Consciente del Movimiento
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory
Cheng-Yen Yang, Hsiang-Wei Huang, Wenhao Chai, Zhongyu Jiang, Jenq-Neng Hwang
•
Nov 18, 2024
•
19
3
Cuando la Precisión se Encuentra con la Posición: BFloat16 Descompone RoPE en el Entrenamiento de Contexto Largo
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training
Haonan Wang, Qian Liu, Chao Du, Tongyao Zhu, Cunxiao Du, Kenji Kawaguchi, Tianyu Pang
•
Nov 20, 2024
•
16
2
¿Es tu LLM Secretamente un Modelo Mundial de Internet? Planificación Basada en Modelos para Agentes Web
Is Your LLM Secretly a World Model of the Internet? Model-Based Planning for Web Agents
Yu Gu, Boyuan Zheng, Boyu Gou, Kai Zhang, Cheng Chang, Sanjari Srivastava, Yanan Xie, Peng Qi, Huan Sun, Yu Su
•
Nov 10, 2024
•
14
2
Estilocódigos: Codificación de Información Estilística para la Generación de Imágenes
Stylecodes: Encoding Stylistic Information For Image Generation
Ciara Rowles
•
Nov 19, 2024
•
12
2
ViBe: Un conjunto de datos Texto-a-Video para evaluar la alucinación en modelos multimodales grandes.
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models
Vipula Rawte, Sarthak Jain, Aarush Sinha, Garv Kaushik, Aman Bansal, Prathiksha Rumale Vishwanath, Samyak Rajesh Jain, Aishwarya Naresh Reganti, Vinija Jain, Aman Chadha, Amit P. Sheth, Amitava Das
•
Nov 16, 2024
•
10
4
Predicción de Pérdida a Pérdida: Leyes de Escala para Todos los Conjuntos de Datos
Loss-to-Loss Prediction: Scaling Laws for All Datasets
David Brandfonbrener, Nikhil Anand, Nikhil Vyas, Eran Malach, Sham Kakade
•
Nov 19, 2024
•
5
2
Generación de Escenas Compuestas a través de la Generación de Instancias RGBA de Texto a Imagen.
Generating Compositional Scenes via Text-to-image RGBA Instance Generation
Alessandro Fontanella, Petru-Daniel Tudosiu, Yongxin Yang, Shifeng Zhang, Sarah Parisot
•
Nov 16, 2024
•
4
2
ORID: Marco de trabajo impulsado por la información de órganos y regiones para la generación de informes de radiología
ORID: Organ-Regional Information Driven Framework for Radiology Report Generation
Tiancheng Gu, Kaicheng Yang, Xiang An, Ziyong Feng, Dongnan Liu, Weidong Cai
•
Nov 20, 2024
•
2
2