Papers Diarios
Más allá del '¡Ajá!': Hacia una alineación sistemática de meta-habilidades en modelos de razonamiento a gran escalaBeyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
Más allá del '¡Ajá!': Hacia una alineación sistemática de meta-habilidades en modelos de razonamiento a gran escala
Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
Zhiyuan Hu, Yibo Wang, Hanze Dong, Yuhui Xu, Amrita Saha, Caiming Xiong, Bryan Hooi, Junnan Li•May 15, 2025•973
Ley de Escalado Paralelo para Modelos de LenguajeParallel Scaling Law for Language Models
Ley de Escalado Paralelo para Modelos de Lenguaje
Parallel Scaling Law for Language Models
Mouxiang Chen, Binyuan Hui, Zeyu Cui, Jiaxi Yang, Dayiheng Liu, Jianling Sun, Junyang Lin, Zhongxin Liu•May 15, 2025•533
Optimización de Prompts del Sistema con MetaaprendizajeSystem Prompt Optimization with Meta-Learning
Optimización de Prompts del Sistema con Metaaprendizaje
System Prompt Optimization with Meta-Learning
Yumin Choi, Jinheon Baek, Sung Ju Hwang•May 14, 2025•533
OpenThinkIMG: Aprendiendo a pensar con imágenes mediante el refuerzo de herramientas visualesOpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
OpenThinkIMG: Aprendiendo a pensar con imágenes mediante el refuerzo de herramientas visuales
OpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
Zhaochen Su, Linjie Li, Mingyang Song, Yunzhuo Hao, Zhengyuan Yang, Jun Zhang, Guanjie Chen, Jiawei Gu, Juntao Li, Xiaoye Qu, Yu Cheng•May 13, 2025•293
EnerVerse-AC: Visualización de Entornos Encarnados con Condición de AcciónEnerVerse-AC: Envisioning Embodied Environments with Action Condition
EnerVerse-AC: Visualización de Entornos Encarnados con Condición de Acción
EnerVerse-AC: Envisioning Embodied Environments with Action Condition
Yuxin Jiang, Shengcong Chen, Siyuan Huang, Liliang Chen, Pengfei Zhou, Yue Liao, Xindong He, Chiming Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren•May 14, 2025•182
Ajuste de Tokenizador Visual de Extremo a ExtremoEnd-to-End Vision Tokenizer Tuning
Ajuste de Tokenizador Visual de Extremo a Extremo
End-to-End Vision Tokenizer Tuning
Wenxuan Wang, Fan Zhang, Yufeng Cui, Haiwen Diao, Zhuoyan Luo, Huchuan Lu, Jing Liu, Xinlong Wang•May 15, 2025•173
WorldPM: Escalando el Modelado de Preferencias HumanasWorldPM: Scaling Human Preference Modeling
WorldPM: Escalando el Modelado de Preferencias Humanas
WorldPM: Scaling Human Preference Modeling
Binghai Wang, Runji Lin, Keming Lu, Le Yu, Zhenru Zhang, Fei Huang, Chujie Zheng, Kai Dang, Yang Fan, Xingzhang Ren, An Yang, Binyuan Hui, Dayiheng Liu, Tao Gui, Qi Zhang, Xuanjing Huang, Yu-Gang Jiang, Bowen Yu, Jingren Zhou, Junyang Lin•May 15, 2025•172
La Enciclopedia CoT: Analizando, Prediciendo y Controlando cómo Piensa un Modelo de RazonamientoThe CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
La Enciclopedia CoT: Analizando, Prediciendo y Controlando cómo Piensa un Modelo de Razonamiento
The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
Seongyun Lee, Seungone Kim, Minju Seo, Yongrae Jo, Dongyoung Go, Hyeonbin Hwang, Jinho Park, Xiang Yue, Sean Welleck, Graham Neubig, Moontae Lee, Minjoon Seo•May 15, 2025•172
J1: Incentivizando el pensamiento en LLM-como-juez mediante aprendizaje por refuerzoJ1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
J1: Incentivizando el pensamiento en LLM-como-juez mediante aprendizaje por refuerzo
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
Chenxi Whitehouse, Tianlu Wang, Ping Yu, Xian Li, Jason Weston, Ilia Kulikov, Swarnadeep Saha•May 15, 2025•152
EWMBench: Evaluación de la Calidad Escénica, de Movimiento y Semántica en Modelos de Mundo EncarnadosEWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
EWMBench: Evaluación de la Calidad Escénica, de Movimiento y Semántica en Modelos de Mundo Encarnados
EWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
Hu Yue, Siyuan Huang, Yue Liao, Shengcong Chen, Pengfei Zhou, Liliang Chen, Maoqing Yao, Guanghui Ren•May 14, 2025•152
MLE-Dojo: Entornos Interactivos para Potenciar Agentes de LLM en Ingeniería de Aprendizaje AutomáticoMLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
MLE-Dojo: Entornos Interactivos para Potenciar Agentes de LLM en Ingeniería de Aprendizaje Automático
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
Rushi Qiang, Yuchen Zhuang, Yinghao Li, Dingu Sagar V K, Rongzhi Zhang, Changhao Li, Ian Shu-Hei Wong, Sherry Yang, Percy Liang, Chao Zhang, Bo Dai•May 12, 2025•152
Unilogit: Eliminación Robusta de Aprendizaje en Máquinas para LLMs mediante Autodistribución con Objetivo UniformeUnilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Unilogit: Eliminación Robusta de Aprendizaje en Máquinas para LLMs mediante Autodistribución con Objetivo Uniforme
Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Stefan Vasilev, Christian Herold, Baohao Liao, Seyyed Hadi Hashemi, Shahram Khadivi, Christof Monz•May 9, 2025•152
Personalización de Estilo en la Generación de Texto a Vector con Prior de Difusión de ImágenesStyle Customization of Text-to-Vector Generation with Image Diffusion
Priors
Personalización de Estilo en la Generación de Texto a Vector con Prior de Difusión de Imágenes
Style Customization of Text-to-Vector Generation with Image Diffusion
Priors
Peiying Zhang, Nanxuan Zhao, Jing Liao•May 15, 2025•133
Profundidad Cualquier Cosa con Cualquier PriorDepth Anything with Any Prior
Profundidad Cualquier Cosa con Cualquier Prior
Depth Anything with Any Prior
Zehan Wang, Siyu Chen, Lihe Yang, Jialei Wang, Ziang Zhang, Hengshuang Zhao, Zhou Zhao•May 15, 2025•112
PointArena: Exploración del Anclaje Multimodal a través de la Indicación Guiada por LenguajePointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
PointArena: Exploración del Anclaje Multimodal a través de la Indicación Guiada por Lenguaje
PointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
Long Cheng, Jiafei Duan, Yi Ru Wang, Haoquan Fang, Boyang Li, Yushan Huang, Elvis Wang, Ainaz Eftekhar, Jason Lee, Wentao Yuan, Rose Hendrix, Noah A. Smith, Fei Xia, Dieter Fox, Ranjay Krishna•May 15, 2025•112
Explorando la Fusión Profunda de Modelos de Lenguaje a Gran Escala y Transformadores de Difusión para la Síntesis de Texto a ImagenExploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
Explorando la Fusión Profunda de Modelos de Lenguaje a Gran Escala y Transformadores de Difusión para la Síntesis de Texto a Imagen
Exploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
Bingda Tang, Boyang Zheng, Xichen Pan, Sayak Paul, Saining Xie•May 15, 2025•102
Logrando flexibilidad en el tokenizador de modelos de lenguaje mediante adaptación heurística y aprendizaje de supertokensAchieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
Logrando flexibilidad en el tokenizador de modelos de lenguaje mediante adaptación heurística y aprendizaje de supertokens
Achieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
Shaurya Sharthak, Vinayak Pahalwan, Adithya Kamath, Adarsh Shirawalmath•May 14, 2025•92
3D-Fixup: Avanzando en la edición de fotos con conocimientos previos en 3D3D-Fixup: Advancing Photo Editing with 3D Priors
3D-Fixup: Avanzando en la edición de fotos con conocimientos previos en 3D
3D-Fixup: Advancing Photo Editing with 3D Priors
Yen-Chi Cheng, Krishna Kumar Singh, Jae Shin Yoon, Alex Schwing, Liangyan Gui, Matheus Gadelha, Paul Guerrero, Nanxuan Zhao•May 15, 2025•82
Agentes de IA vs. IA Agéntica: Una Taxonomía Conceptual, Aplicaciones y DesafíosAI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
Agentes de IA vs. IA Agéntica: Una Taxonomía Conceptual, Aplicaciones y Desafíos
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
Ranjan Sapkota, Konstantinos I. Roumeliotis, Manoj Karkee•May 15, 2025•72
ReSurgSAM2: Segmentación Referencial en Videos Quirúrgicos mediante Seguimiento Fiable a Largo PlazoReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
ReSurgSAM2: Segmentación Referencial en Videos Quirúrgicos mediante Seguimiento Fiable a Largo Plazo
ReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
Haofeng Liu, Mingqi Gao, Xuxiao Luo, Ziyue Wang, Guanyi Qin, Junde Wu, Yueming Jin•May 13, 2025•72
QuXAI: Explicadores para Modelos Híbridos de Aprendizaje Automático CuánticoQuXAI: Explainers for Hybrid Quantum Machine Learning Models
QuXAI: Explicadores para Modelos Híbridos de Aprendizaje Automático Cuántico
QuXAI: Explainers for Hybrid Quantum Machine Learning Models
Saikat Barua, Mostafizur Rahman, Shehenaz Khaled, Md Jafor Sadek, Rafiul Islam, Shahnewaz Siddique•May 15, 2025•53
AdaptCLIP: Adaptación de CLIP para la Detección Universal de Anomalías VisualesAdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
AdaptCLIP: Adaptación de CLIP para la Detección Universal de Anomalías Visuales
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
Bin-Bin Gao, Yue Zhu, Jiangtao Yan, Yuezhi Cai, Weixi Zhang, Meng Wang, Jun Liu, Yong Liu, Lei Wang, Chengjie Wang•May 15, 2025•54
Real2Render2Real: Escalando Datos Robóticos Sin Simulación de Dinámica ni Hardware RobóticoReal2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Real2Render2Real: Escalando Datos Robóticos Sin Simulación de Dinámica ni Hardware Robótico
Real2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Justin Yu, Letian Fu, Huang Huang, Karim El-Refai, Rares Andrei Ambrus, Richard Cheng, Muhammad Zubair Irshad, Ken Goldberg•May 14, 2025•42
Generación Impulsada por Anomalías con Pocos Ejemplos para Clasificación y Segmentación de AnomalíasFew-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
Generación Impulsada por Anomalías con Pocos Ejemplos para Clasificación y Segmentación de Anomalías
Few-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu•May 14, 2025•42
X-Sim: Aprendizaje Transcorporal a través de Real-a-Sim-a-RealX-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
X-Sim: Aprendizaje Transcorporal a través de Real-a-Sim-a-Real
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury•May 11, 2025•32