ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 4th, 2025
Segmentación Panóptica No Supervisada Centrada en Escenas
Scene-Centric Unsupervised Panoptic Segmentation
Oliver Hahn, Christoph Reich, Nikita Araslanov, Daniel Cremers, Christian Rupprecht, Stefan Roth
•
Apr 2, 2025
•
5
3
JavisDiT: Transformador de Difusión Conjunta Audio-Video con Sincronización Jerárquica de Prioridades Espacio-Temporales
JavisDiT: Joint Audio-Video Diffusion Transformer with Hierarchical Spatio-Temporal Prior Synchronization
Kai Liu, Wei Li, Lai Chen, Shengqiong Wu, Yanhao Zheng, Jiayi Ji, Fan Zhou, Rongxin Jiang, Jiebo Luo, Hao Fei, Tat-Seng Chua
•
Mar 30, 2025
•
54
4
SkyReels-A2: Compón cualquier cosa en Transformadores de Difusión de Video
SkyReels-A2: Compose Anything in Video Diffusion Transformers
Zhengcong Fei, Debang Li, Di Qiu, Jiahua Wang, Yikun Dou, Rui Wang, Jingtao Xu, Mingyuan Fan, Guibin Chen, Yang Li, Yahui Zhou
•
Apr 3, 2025
•
36
3
Whisper-LM: Mejora de modelos de reconocimiento automático del habla con modelos de lenguaje para idiomas de bajos recursos
Whisper-LM: Improving ASR Models with Language Models for Low-Resource Languages
Xabier de Zuazo, Eva Navas, Ibon Saratxaga, Inma Hernáez Rioja
•
Mar 30, 2025
•
10
3
Avances y Desafíos en Agentes Fundamentales: Desde la Inteligencia Inspirada en el Cerebro Hacia Sistemas Evolutivos, Colaborativos y Seguros
Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems
Bang Liu, Xinfeng Li, Jiayi Zhang, Jinlin Wang, Tanjin He, Sirui Hong, Hongzhang Liu, Shaokun Zhang, Kaitao Song, Kunlun Zhu, Yuheng Cheng, Suyuchen Wang, Xiaoqiang Wang, Yuyu Luo, Haibo Jin, Peiyan Zhang, Ollie Liu, Jiaqi Chen, Huan Zhang, Zhaoyang Yu, Haochen Shi, Boyan Li, Dekun Wu, Fengwei Teng, Xiaojun Jia, Jiawei Xu, Jinyu Xiang, Yizhang Lin, Tianming Liu, Tongliang Liu, Yu Su, Huan Sun, Glen Berseth, Jianyun Nie, Ian Foster, Logan Ward, Qingyun Wu, Yu Gu, Mingchen Zhuge, Xiangru Tang, Haohan Wang, Jiaxuan You, Chi Wang, Jian Pei, Qiang Yang, Xiaoliang Qi, Chenglin Wu
•
Mar 31, 2025
•
270
7
OpenCodeReasoning: Avanzando en la Destilación de Datos para la Programación Competitiva
OpenCodeReasoning: Advancing Data Distillation for Competitive Coding
Wasi Uddin Ahmad, Sean Narenthiran, Somshubra Majumdar, Aleksander Ficek, Siddhartha Jain, Jocelyn Huang, Vahid Noroozi, Boris Ginsburg
•
Apr 2, 2025
•
15
3
Difusión de Video Controlada Audiovisual con Modelado de Espacios de Estado Selectivo Enmascarado para la Generación de Cabezas Parlantes Naturales
Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation
Fa-Ting Hong, Zunnan Xu, Zixiang Zhou, Jun Zhou, Xiu Li, Qin Lin, Qinglin Lu, Dan Xu
•
Apr 3, 2025
•
44
7
Interpretación de la Planificación Emergente en el Aprendizaje por Refuerzo sin Modelo
Interpreting Emergent Planning in Model-Free Reinforcement Learning
Thomas Bush, Stephen Chung, Usman Anwar, Adrià Garriga-Alonso, David Krueger
•
Apr 2, 2025
•
12
2
NeuralGS: Uniendo campos neuronales y splatting de Gaussianas 3D para representaciones 3D compactas
NeuralGS: Bridging Neural Fields and 3D Gaussian Splatting for Compact 3D Representations
Zhenyu Tang, Chaoran Feng, Xinhua Cheng, Wangbo Yu, Junwu Zhang, Yuan Liu, Xiaoxiao Long, Wenping Wang, Li Yuan
•
Mar 29, 2025
•
11
2
WikiVideo: Generación de Artículos a partir de Múltiples Videos
WikiVideo: Article Generation from Multiple Videos
Alexander Martin, Reno Kriz, William Gantt Walden, Kate Sanders, Hannah Recknor, Eugene Yang, Francis Ferraro, Benjamin Van Durme
•
Apr 1, 2025
•
36
3
Generación de Parámetros de Redes Neuronales Autoregresivas Guiadas por Instrucciones
Instruction-Guided Autoregressive Neural Network Parameter Generation
Soro Bedionita, Bruno Andreis, Song Chong, Sung Ju Hwang
•
Apr 2, 2025
•
6
2
Replanteando la Escalabilidad de RL para Modelos de Visión y Lenguaje: Un Marco Transparente desde Cero y un Esquema de Evaluación Integral
Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme
Yan Ma, Steffi Chern, Xuyang Shen, Yiran Zhong, Pengfei Liu
•
Apr 3, 2025
•
30
3
Análisis de Escalabilidad de Modelos de Lenguaje Intercalados de Habla y Texto
Scaling Analysis of Interleaved Speech-Text Language Models
Gallil Maimon, Michael Hassid, Amit Roth, Yossi Adi
•
Apr 3, 2025
•
28
2
Selección Eficiente de Modelos para Pronósticos de Series Temporales mediante LLMs
Efficient Model Selection for Time Series Forecasting via LLMs
Wang Wei, Tiankai Yang, Hongjie Chen, Ryan A. Rossi, Yue Zhao, Franck Dernoncourt, Hoda Eldardiry
•
Apr 2, 2025
•
16
2
ZClip: Mitigación Adaptativa de Picos para el Preentrenamiento de Modelos de Lenguaje de Gran Escala
ZClip: Adaptive Spike Mitigation for LLM Pre-Training
Abhay Kumar, Louis Owen, Nilabhra Roy Chowdhury, Fabian Güra
•
Apr 3, 2025
•
77
2
Leyes de Escalabilidad en el Descubrimiento Científico con IA y Científicos Robóticos
Scaling Laws in Scientific Discovery with AI and Robot Scientists
Pengsong Zhang, Heng Zhang, Huazhe Xu, Renjun Xu, Zhenting Wang, Cong Wang, Animesh Garg, Zhibin Li, Arash Ajoudani, Xinyu Liu
•
Mar 28, 2025
•
12
2
Imaginando más allá de los píxeles: Evaluación de la edición visual basada en razonamiento
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing
Xiangyu Zhao, Peiyuan Zhang, Kexian Tang, Hao Li, Zicheng Zhang, Guangtao Zhai, Junchi Yan, Hua Yang, Xue Yang, Haodong Duan
•
Apr 3, 2025
•
67
2
Los Autoencoders Dispersos Aprenden Características Monosemánticas en Modelos de Visión-Lenguaje
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models
Mateusz Pach, Shyamgopal Karthik, Quentin Bouniot, Serge Belongie, Zeynep Akata
•
Apr 3, 2025
•
10
2
GPT-ImgEval: Un Benchmark Integral para Diagnosticar GPT4o en la Generación de Imágenes
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation
Zhiyuan Yan, Junyan Ye, Weijia Li, Zilong Huang, Shenghai Yuan, Xiangyang He, Kaiqing Lin, Jun He, Conghui He, Li Yuan
•
Apr 3, 2025
•
56
3
Escalado en Tiempo de Inferencia para Modelado de Recompensas Generalista
Inference-Time Scaling for Generalist Reward Modeling
Zijun Liu, Peiyi Wang, Runxin Xu, Shirong Ma, Chong Ruan, Peng Li, Yang Liu, Yu Wu
•
Apr 3, 2025
•
54
6
GenPRM: Escalando el Cómputo en Tiempo de Prueba de Modelos de Recompensa de Procesos mediante Razonamiento Generativo
GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning
Jian Zhao, Runze Liu, Kaiyan Zhang, Zhimu Zhou, Junqi Gao, Dong Li, Jiafei Lyu, Zhouyi Qian, Biqing Qi, Xiu Li, Bowen Zhou
•
Apr 1, 2025
•
12
3
ShortV: Modelos Multimodales de Lenguaje Grande Eficientes mediante la Congelación de Tokens Visuales en Capas Inefectivas
ShortV: Efficient Multimodal Large Language Models by Freezing Visual Tokens in Ineffective Layers
Qianhao Yuan, Qingyu Zhang, Yanjiang Liu, Jiawei Chen, Yaojie Lu, Hongyu Lin, Jia Zheng, Xianpei Han, Le Sun
•
Apr 1, 2025
•
21
2
FreSca: Revelando el Espacio de Escalado en Modelos de Difusión
FreSca: Unveiling the Scaling Space in Diffusion Models
Chao Huang, Susan Liang, Yunlong Tang, Li Ma, Yapeng Tian, Chenliang Xu
•
Apr 2, 2025
•
19
2