ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
December 23rd, 2024
Domando el Entrenamiento Conjunto Multimodal para la Síntesis de Video a Audio de Alta Calidad
Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Ho Kei Cheng, Masato Ishii, Akio Hayakawa, Takashi Shibuya, Alexander Schwing, Yuki Mitsufuji
•
Dec 19, 2024
•
18
2
TRecViT: Un Transformador de Video Recurrente
TRecViT: A Recurrent Video Transformer
Viorica Pătrăucean, Xu Owen He, Joseph Heyward, Chuhan Zhang, Mehdi S. M. Sajjadi, George-Cristian Muraru, Artem Zholus, Mahdi Karami, Ross Goroshin, Yutian Chen, Simon Osindero, João Carreira, Razvan Pascanu
•
Dec 18, 2024
•
13
4
Fietje: Un LLM abierto y eficiente para el idioma neerlandés.
Fietje: An open, efficient LLM for Dutch
Bram Vanroy
•
Dec 19, 2024
•
4
3
Resumen de texto Multi-LLM
Multi-LLM Text Summarization
Jiangnan Fang, Cheng-Tse Liu, Jieun Kim, Yash Bhedaru, Ethan Liu, Nikhil Singh, Nedim Lipka, Puneet Mathur, Nesreen K. Ahmed, Franck Dernoncourt, Ryan A. Rossi, Hanieh Deilamsalehy
•
Dec 20, 2024
•
6
2
CLEAR: Linearización tipo convolucional revierte transformadores de difusión pre-entrenados
CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up
Songhua Liu, Zhenxiong Tan, Xinchao Wang
•
Dec 20, 2024
•
23
5
Generación Visual Autoregresiva Paralelizada
Parallelized Autoregressive Visual Generation
Yuqing Wang, Shuhuai Ren, Zhijie Lin, Yujin Han, Haoyuan Guo, Zhenheng Yang, Difan Zou, Jiashi Feng, Xihui Liu
•
Dec 19, 2024
•
54
2
Aprendizaje por Refuerzo sin Conexión para Razonamiento de Varios Pasos en LLM
Offline Reinforcement Learning for LLM Multi-Step Reasoning
Huaijie Wang, Shibo Hao, Hanze Dong, Shenao Zhang, Yilin Bao, Ziran Yang, Yi Wu
•
Dec 20, 2024
•
39
6
La Secuencia Importa: Aprovechando Modelos de Video en la Super-Resolución 3D
Sequence Matters: Harnessing Video Models in 3D Super-Resolution
Hyun-kyu Ko, Dongheok Park, Youngin Park, Byeonghyeon Lee, Juhee Han, Eunbyung Park
•
Dec 16, 2024
•
11
2
MixLLM: Cuantización LLM con Precisión Mixta Global entre Características de Salida y Diseño de Sistema Altamente Eficiente
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design
Zhen Zheng, Xiaonan Song, Chuanjie Liu
•
Dec 19, 2024
•
14
5
IDOL: Creación instantánea de humanos en 3D fotorrealistas a partir de una sola imagen
IDOL: Instant Photorealistic 3D Human Creation from a Single Image
Yiyu Zhuang, Jiaxi Lv, Hao Wen, Qing Shuai, Ailing Zeng, Hao Zhu, Shifeng Chen, Yujiu Yang, Xun Cao, Wei Liu
•
Dec 19, 2024
•
6
2
Hacia una Descripción de Imágenes Hiperdetallada Robusta: Un Enfoque Multiagente y Métricas de Evaluación Dual para la Factualidad y Cobertura
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage
Saehyung Lee, Seunghyun Yoon, Trung Bui, Jing Shi, Sungroh Yoon
•
Dec 20, 2024
•
15
2
LLMs perdidos en la traducción: M-ALERT descubre brechas de seguridad interlingüísticas.
LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Gaps
Felix Friedrich, Simone Tedeschi, Patrick Schramowski, Manuel Brack, Roberto Navigli, Huu Nguyen, Bo Li, Kristian Kersting
•
Dec 19, 2024
•
4
3
ALCANCE: Optimización de la Compresión de la Caché de Clave-Valor en la Generación de Contextos Largos
SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation
Jialong Wu, Zhenglin Wang, Linhai Zhang, Yilong Lai, Yulan He, Deyu Zhou
•
Dec 18, 2024
•
20
3