ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
March 13th, 2025
RewardSDS: Alineación de la Distilación de Puntuaciones mediante Muestreo Ponderado por Recompensas
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling
Itay Chachy, Guy Yariv, Sagie Benaim
•
Mar 12, 2025
•
15
2
GTR: Refuerzo Guiado del Pensamiento Previene el Colapso del Pensamiento en el Entrenamiento de Agentes VLM Basados en RL
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye
•
Mar 11, 2025
•
17
2
Cuantización de Modelos de Lenguaje de Gran Escala para la Generación de Código: Una Replicación Diferenciada
Quantizing Large Language Models for Code Generation: A Differentiated Replication
Alessandro Giagnorio, Antonio Mastropaolo, Saima Afrin, Massimiliano Di Penta, Gabriele Bavota
•
Mar 10, 2025
•
8
2
MoC: Mezclas de Aprendices de Segmentación de Texto para Sistemas de Generación Aumentada por Recuperación
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Mar 12, 2025
•
4
3
PhysicsGen: ¿Pueden los modelos generativos aprender de imágenes para predecir relaciones físicas complejas?
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations?
Martin Spitznagel, Jan Vaillant, Janis Keuper
•
Mar 7, 2025
•
8
2
Más Documentos, Misma Longitud: Aislando el Desafío de Múltiples Documentos en RAG
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG
Shahar Levy, Nir Mazor, Lihi Shalmon, Michael Hassid, Gabriel Stanovsky
•
Mar 6, 2025
•
16
3
Movimiento Cualquiera: Generación de Cualquier cosa a Movimiento
Motion Anything: Any to Motion Generation
Zeyu Zhang, Yiran Wang, Wei Mao, Danning Li, Rui Zhao, Biao Wu, Zirui Song, Bohan Zhuang, Ian Reid, Richard Hartley
•
Mar 10, 2025
•
32
6
VLog: Modelos de Video-Lenguaje mediante Recuperación Generativa de Narraciones Vocabulario
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
Kevin Qinghong Lin, Mike Zheng Shou
•
Mar 12, 2025
•
7
2
Atención de Consultas Agrupadas Óptima en Costo para LLMs de Contexto Largo
Cost-Optimal Grouped-Query Attention for Long-Context LLMs
Yingfa Chen, Yutong Wu, Xu Han, Zhiyuan Liu, Maosong Sun
•
Mar 12, 2025
•
5
2
Monte Carlo de Difusión para RANSAC Basado en Aprendizaje Generalizable
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC
Jiale Wang, Chen Zhao, Wei Ke, Tong Zhang
•
Mar 12, 2025
•
1
2
Block Diffusion: Interpolación entre Modelos de Lenguaje Autoregresivos y de Difusión
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models
Marianne Arriola, Aaron Gokaslan, Justin T Chiu, Zhihan Yang, Zhixuan Qi, Jiaqi Han, Subham Sekhar Sahoo, Volodymyr Kuleshov
•
Mar 12, 2025
•
71
3
WildIFEval: Seguimiento de Instrucciones en Entornos Naturales
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
•
Mar 9, 2025
•
13
4
BIMBA: Compresión de Escaneo Selectivo para Respuestas a Preguntas en Videos de Largo Alcance
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani
•
Mar 12, 2025
•
3
2
Comprensión y Mitigación de Cambios en la Distribución para el Aprendizaje Automático Campos de Fuerza
Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields
Tobias Kreiman, Aditi S. Krishnapriyan
•
Mar 11, 2025
•
0
3
Asistente Médico Basado en Agentes Múltiples para Dispositivos de Borde
Multi Agent based Medical Assistant for Edge Devices
Sakharam Gawade, Shivam Akhouri, Chinmay Kulkarni, Jagdish Samant, Pragya Sahu, Aastik, Jai Pahal, Saswat Meher
•
Mar 7, 2025
•
7
2
Modelos de Difusión Latente Libres de Alias: Mejorando la Equivariancia de Desplazamiento Fraccional en el Espacio Latente de Difusión
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space
Yifan Zhou, Zeqi Xiao, Shuai Yang, Xingang Pan
•
Mar 12, 2025
•
6
2
Search-R1: Entrenamiento de Modelos de Lenguaje Grande para Razonar y Aprovechar Motores de Búsqueda con Aprendizaje por Refuerzo
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han
•
Mar 12, 2025
•
28
2
Cuando el Modelo de Visión y Lenguaje a Gran Escala Encuentra Imágenes de Teledetección de Gran Tamaño: Poda de Tokens Guiada por Texto de Manera Gruesa a Fina
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning
Junwei Luo, Yingying Zhang, Xue Yang, Kang Wu, Qi Zhu, Lei Liang, Jingdong Chen, Yansheng Li
•
Mar 10, 2025
•
7
3
Modelado de Lenguaje Multimodal para Análisis y Generación de Transcriptómica de Célula Única de Alta Precisión
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation
Yaorui Shi, Jiaqi Yang, Sihang Li, Junfeng Fang, Xiang Wang, Zhiyuan Liu, Yang Zhang
•
Mar 12, 2025
•
4
2
Autoaprendizaje y Autocorrección para Modelos de Lenguaje Pequeños
Self-Taught Self-Correction for Small Language Models
Viktor Moskvoretskii, Chris Biemann, Irina Nikishina
•
Mar 11, 2025
•
15
2
TPDiff: Modelo de Difusión de Pirámide Temporal para Vídeo
TPDiff: Temporal Pyramid Video Diffusion Model
Lingmin Ran, Mike Zheng Shou
•
Mar 12, 2025
•
45
3
Reangle-A-Video: Generación de videos 4D como traducción de video a video
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation
Hyeonho Jeong, Suhyeon Lee, Jong Chul Ye
•
Mar 12, 2025
•
32
2