ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
February 13th, 2025
DPO-Shift: Cambiando la Distribución de la Optimización de Preferencia Directa
DPO-Shift: Shifting the Distribution of Direct Preference Optimization
Xiliang Yang, Feng Jiang, Qianen Zhang, Lei Zhao, Xiao Li
•
Feb 11, 2025
•
15
2
¡Ignora la penalización de KL! Impulso a la exploración en tokens críticos para mejorar el ajuste fino de RL.
Ignore the KL Penalty! Boosting Exploration on Critical Tokens to Enhance RL Fine-Tuning
Jean Vassoyan, Nathanaël Beau, Roman Plaud
•
Feb 10, 2025
•
18
2
Hacia la Generación Aumentada de Recuperación Confiable para Modelos de Lenguaje Grandes: Una Encuesta
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
•
Feb 8, 2025
•
8
2
WorldGUI: Pruebas Dinámicas para Automatización Integral de Interfaces Gráficas de Usuario en Escritorio
WorldGUI: Dynamic Testing for Comprehensive Desktop GUI Automation
Henry Hengyuan Zhao, Difei Gao, Mike Zheng Shou
•
Feb 12, 2025
•
27
4
TextAtlas5M: Un conjunto de datos a gran escala para la generación de imágenes de texto denso
TextAtlas5M: A Large-scale Dataset for Dense Text Image Generation
Alex Jinpeng Wang, Dongxing Mao, Jiawei Zhang, Weiming Han, Zhuobai Dong, Linjie Li, Yiqi Lin, Zhengyuan Yang, Libo Qin, Fuwei Zhang, Lijuan Wang, Min Li
•
Feb 11, 2025
•
45
2
LASP-2: Repensando el Paralelismo de Secuencia para Atención Lineal y su Híbrido
LASP-2: Rethinking Sequence Parallelism for Linear Attention and Its Hybrid
Weigao Sun, Disen Lan, Yiran Zhong, Xiaoye Qu, Yu Cheng
•
Feb 11, 2025
•
24
2
Light-A-Video: Relumbrado de video sin entrenamiento a través de la Fusión de Luz Progresiva
Light-A-Video: Training-free Video Relighting via Progressive Light Fusion
Yujie Zhou, Jiazi Bu, Pengyang Ling, Pan Zhang, Tong Wu, Qidong Huang, Jinsong Li, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Anyi Rao, Jiaqi Wang, Li Niu
•
Feb 12, 2025
•
44
2
TransMLA: Atención Latente Multi-cabeza es Todo lo que Necesitas
TransMLA: Multi-head Latent Attention Is All You Need
Fanxu Meng, Zengwei Yao, Muhan Zhang
•
Feb 11, 2025
•
49
9
Controlador de EDP: LLM para Autoformalización y Razonamiento de EDP
PDE-Controller: LLMs for Autoformalization and Reasoning of PDEs
Mauricio Soroco, Jialin Song, Mengzhou Xia, Kye Emond, Weiran Sun, Wuyang Chen
•
Feb 3, 2025
•
16
2
MetaSC: Optimización de la Especificación de Seguridad en Tiempo de Prueba para Modelos de Lenguaje
MetaSC: Test-Time Safety Specification Optimization for Language Models
Víctor Gallego
•
Feb 11, 2025
•
3
2
Artículo 1: Sobre la Transferibilidad de LLMs Mejorados con Razonamiento a Finanzas
Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance
Lingfei Qian, Weipeng Zhou, Yan Wang, Xueqing Peng, Jimin Huang, Qianqian Xie
•
Feb 12, 2025
•
56
5
SARChat-Bench-2M: Un banco de pruebas visión-lenguaje multi-tarea para la interpretación de imágenes SAR.
SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation
Zhiming Ma, Xiayang Xiao, Sihao Dong, Peidong Wang, HaiPeng Wang, Qingyun Pan
•
Feb 12, 2025
•
12
4
Módulos LLM: Transferencia de Conocimiento de un Modelo Grande a uno Pequeño utilizando Atención Cruzada Mejorada
LLM Modules: Knowledge Transfer from a Large to a Small Model using Enhanced Cross-Attention
Konstantin Kolomeitsev
•
Feb 12, 2025
•
4
2
Leyes de Escala de Destilación
Distillation Scaling Laws
Dan Busbridge, Amitis Shidani, Floris Weers, Jason Ramapuram, Etai Littwin, Russ Webb
•
Feb 12, 2025
•
48
4
Animar a Cualquiera 2: Animación de Imágenes de Personajes de Alta Fidelidad con Aprovechamiento del Entorno
Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance
Li Hu, Guangyuan Wang, Zhen Shen, Xin Gao, Dechao Meng, Lian Zhuo, Peng Zhang, Bang Zhang, Liefeng Bo
•
Feb 10, 2025
•
16
4
BenchMAX: un conjunto de evaluación multilingüe exhaustivo para modelos de lenguaje grandes
BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models
Xu Huang, Wenhao Zhu, Hanxu Hu, Conghui He, Lei Li, Shujian Huang, Fei Yuan
•
Feb 11, 2025
•
54
2
Mediador: Fusión LLM eficiente en memoria con menos conflictos de parámetros y enrutamiento basado en incertidumbre.
Mediator: Memory-efficient LLM Merging with Less Parameter Conflicts and Uncertainty Based Routing
Kunfeng Lai, Zhenheng Tang, Xinglin Pan, Peijie Dong, Xiang Liu, Haolan Chen, Li Shen, Bo Li, Xiaowen Chu
•
Feb 6, 2025
•
4
2
Predicción del Próximo Bloque: Generación de Video a través de Modelado Semiautoregresivo
Next Block Prediction: Video Generation via Semi-Autoregressive Modeling
Shuhuai Ren, Shuming Ma, Xu Sun, Furu Wei
•
Feb 11, 2025
•
9
2
CineMaster: Un marco consciente en 3D y controlable para la generación de video a partir de texto cinematográfico.
CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation
Qinghe Wang, Yawen Luo, Xiaoyu Shi, Xu Jia, Huchuan Lu, Tianfan Xue, Xintao Wang, Pengfei Wan, Di Zhang, Kun Gai
•
Feb 12, 2025
•
43
2
NoLiMa: Evaluación de Contexto Largo más Allá de la Coincidencia Literal
NoLiMa: Long-Context Evaluation Beyond Literal Matching
Ali Modarressi, Hanieh Deilamsalehy, Franck Dernoncourt, Trung Bui, Ryan A. Rossi, Seunghyun Yoon, Hinrich Schütze
•
Feb 7, 2025
•
15
2
Prior de Homeomorfismo para el Problema de Falsos Positivos y Negativos en el Aprendizaje de Representaciones Densas Contrastivas de Imágenes Médicas
Homeomorphism Prior for False Positive and Negative Problem in Medical Image Dense Contrastive Representation Learning
Yuting He, Boyu Wang, Rongjun Ge, Yang Chen, Guanyu Yang, Shuo Li
•
Feb 7, 2025
•
0
2
Preentrenamiento de LLM con Conceptos Continuos
LLM Pretraining with Continuous Concepts
Jihoon Tack, Jack Lanchantin, Jane Yu, Andrew Cohen, Ilia Kulikov, Janice Lan, Shibo Hao, Yuandong Tian, Jason Weston, Xian Li
•
Feb 12, 2025
•
28
4