ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 14th, 2025
PixelFlow: Modelos Generativos en el Espacio de Píxeles con Flujo
PixelFlow: Pixel-Space Generative Models with Flow
Shoufa Chen, Chongjian Ge, Shilong Zhang, Peize Sun, Ping Luo
•
Apr 10, 2025
•
19
6
InteractVLM: Razonamiento de Interacción 3D a partir de Modelos Fundamentales 2D
InteractVLM: 3D Interaction Reasoning from 2D Foundational Models
Sai Kumar Dwivedi, Dimitrije Antić, Shashank Tripathi, Omid Taheri, Cordelia Schmid, Michael J. Black, Dimitrios Tzionas
•
Apr 7, 2025
•
5
2
SQL-R1: Entrenamiento de un modelo de razonamiento de lenguaje natural a SQL mediante aprendizaje por refuerzo
SQL-R1: Training Natural Language to SQL Reasoning Model By Reinforcement Learning
Peixian Ma, Xialie Zhuang, Chengjin Xu, Xuhui Jiang, Ran Chen, Jian Guo
•
Apr 11, 2025
•
26
2
Los SAE pueden mejorar el desaprendizaje: Autoencoder Disperso Dinámico como Barreras de Precisión para el Desaprendizaje en LLMs
SAEs Can Improve Unlearning: Dynamic Sparse Autoencoder Guardrails for Precision Unlearning in LLMs
Aashiq Muhamed, Jacopo Bonato, Mona Diab, Virginia Smith
•
Apr 11, 2025
•
4
2
BlenderGym: Evaluación de Sistemas de Modelos Fundamentales para la Edición Gráfica
BlenderGym: Benchmarking Foundational Model Systems for Graphics Editing
Yunqi Gu, Ian Huang, Jihyeon Je, Guandao Yang, Leonidas Guibas
•
Apr 2, 2025
•
6
2
¿Los LLMs a nivel de doctorado realmente comprenden la suma elemental? Explorando el aprendizaje de reglas frente a la memorización en modelos de lenguaje grandes
Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models
Yang Yan, Yu Lu, Renjun Xu, Zhenzhong Lan
•
Apr 7, 2025
•
11
6
Orientación sin entrenamiento en la generación de texto a video mediante planificación multimodal e inicialización de ruido estructurado
Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization
Jialu Li, Shoubin Yu, Han Lin, Jaemin Cho, Jaehong Yoon, Mohit Bansal
•
Apr 11, 2025
•
7
2
UKBOB: Mil Millones de Máscaras Etiquetadas de Resonancia Magnética para Segmentación Generalizable de Imágenes Médicas 3D
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation
Emmanuelle Bourigault, Amir Jamaludin, Abdullah Hamdi
•
Apr 9, 2025
•
7
2
In-2-4D: Interpolación de dos imágenes de vista única a generación 4D
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation
Sauradip Nag, Daniel Cohen-Or, Hao Zhang, Ali Mahdavi-Amiri
•
Apr 11, 2025
•
10
2
ZipIR: Transformador de Difusión de Pirámide Latente para la Restauración de Imágenes de Alta Resolución
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration
Yongsheng Yu, Haitian Zheng, Zhifei Zhang, Jianming Zhang, Yuqian Zhou, Connelly Barnes, Yuchen Liu, Wei Xiong, Zhe Lin, Jiebo Luo
•
Apr 11, 2025
•
18
2
Crónicas Visuales: Utilizando Modelos de Lenguaje Multimodales para Analizar Colecciones Masivas de Imágenes
Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images
Boyang Deng, Songyou Peng, Kyle Genova, Gordon Wetzstein, Noah Snavely, Leonidas Guibas, Thomas Funkhouser
•
Apr 11, 2025
•
11
2
FlexIP: Control Dinámico de Preservación y Personalidad para la Generación Personalizada de Imágenes
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation
Linyan Huang, Haonan Lin, Yanning Zhou, Kaiwen Xiao
•
Apr 10, 2025
•
12
2
Autoencoders de Difusión Latente: Hacia un Aprendizaje de Representaciones No Supervisado Eficaz y Significativo en Imágenes Médicas
Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging
Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
•
Apr 11, 2025
•
5
2
VLM-R1: Un modelo grande de visión y lenguaje estilo R1 estable y generalizable
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model
Haozhan Shen, Peng Liu, Jingcheng Li, Chunxin Fang, Yibo Ma, Jiajia Liao, Qiaoli Shen, Zilun Zhang, Kangjia Zhao, Qianqian Zhang, Ruochen Xu, Tiancheng Zhao
•
Apr 10, 2025
•
31
2
¿ModernBERT o DeBERTaV3? Examinando la influencia de la arquitectura y los datos en el rendimiento de los modelos de codificadores Transformer
ModernBERT or DeBERTaV3? Examining Architecture and Data Influence on Transformer Encoder Models Performance
Wissam Antoun, Benoît Sagot, Djamé Seddah
•
Apr 11, 2025
•
10
3
GigaTok: Escalando Tokenizadores Visuales a 3 Mil Millones de Parámetros para la Generación Autoregresiva de Imágenes
GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation
Tianwei Xiong, Jun Hao Liew, Zilong Huang, Jiashi Feng, Xihui Liu
•
Apr 11, 2025
•
47
2
Seaweed-7B: Entrenamiento Rentable de un Modelo Base para la Generación de Vídeos
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Team Seawead, Ceyuan Yang, Zhijie Lin, Yang Zhao, Shanchuan Lin, Zhibei Ma, Haoyuan Guo, Hao Chen, Lu Qi, Sen Wang, Feng Cheng, Feilong Zuo Xuejiao Zeng, Ziyan Yang, Fangyuan Kong, Zhiwu Qing, Fei Xiao, Meng Wei, Tuyen Hoang, Siyu Zhang, Peihao Zhu, Qi Zhao, Jiangqiao Yan, Liangke Gui, Sheng Bi, Jiashi Li, Yuxi Ren, Rui Wang, Huixia Li, Xuefeng Xiao, Shu Liu, Feng Ling, Heng Zhang, Houmin Wei, Huafeng Kuang, Jerry Duncan, Junda Zhang, Junru Zheng, Li Sun, Manlin Zhang, Renfei Sun, Xiaobin Zhuang, Xiaojie Li, Xin Xia, Xuyan Chi, Yanghua Peng, Yuping Wang, Yuxuan Wang, Zhongkai Zhao, Zhuo Chen, Zuquan Song, Zhenheng Yang, Jiashi Feng, Jianchao Yang, Lu Jiang
•
Apr 11, 2025
•
122
11
MineWorld: un modelo de mundo interactivo en tiempo real y de código abierto en Minecraft
MineWorld: a Real-Time and Open-Source Interactive World Model on Minecraft
Junliang Guo, Yang Ye, Tianyu He, Haoyu Wu, Yushu Jiang, Tim Pearce, Jiang Bian
•
Apr 11, 2025
•
39
3
SpecReason: Cómputo Rápido y Preciso en Tiempo de Inferencia mediante Razonamiento Especulativo
SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning
Rui Pan, Yinwei Dai, Zhihao Zhang, Gabriele Oliaro, Zhihao Jia, Ravi Netravali
•
Apr 10, 2025
•
5
2
CoRAG: Generación Aumentada por Recuperación Colaborativa
CoRAG: Collaborative Retrieval-Augmented Generation
Aashiq Muhamed, Mona Diab, Virginia Smith
•
Apr 2, 2025
•
10
2