ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 22nd, 2025
EasyEdit2: Un marco de dirección fácil de usar para la edición de modelos de lenguaje grande
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models
Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
•
Apr 21, 2025
•
21
2
LeetCodeDataset: Un conjunto de datos temporal para la evaluación robusta y el entrenamiento eficiente de modelos de lenguaje de código (Code LLMs)
LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs
Yunhui Xia, Wei Shen, Yan Wang, Jason Klein Liu, Huifeng Sun, Siyue Wu, Jian Hu, Xiaolong Xu
•
Apr 20, 2025
•
19
2
Ver desde otra perspectiva: Evaluación de la comprensión multi-vista en MLLMs
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs
Chun-Hsiao Yeh, Chenyu Wang, Shengbang Tong, Ta-Ying Cheng, Rouyu Wang, Tianzhe Chu, Yuexiang Zhai, Yubei Chen, Shenghua Gao, Yi Ma
•
Apr 21, 2025
•
22
2
InfiGUI-R1: Avanzando en agentes GUI multimodales desde actores reactivos hasta razonadores deliberativos
InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners
Yuhang Liu, Pengxiang Li, Congkai Xie, Xavier Hu, Xiaotian Han, Shengyu Zhang, Hongxia Yang, Fei Wu
•
Apr 19, 2025
•
13
2
LoftUp: Aprendizaje de un Muestreador Ascendente de Características Basado en Coordenadas para Modelos Fundamentales de Visión
LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models
Haiwen Huang, Anpei Chen, Volodymyr Havrylov, Andreas Geiger, Dan Zhang
•
Apr 18, 2025
•
4
2
Detección de Objetos RF-DETR vs YOLOv12: Un Estudio de Arquitecturas Basadas en Transformers y CNN para la Detección de Frutos Verdes en Clases Únicas y Múltiples en Entornos Complejos de Huertos Bajo Ambiguidad de Etiquetas
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity
Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, Manoj Karkee
•
Apr 17, 2025
•
4
2
FlowReasoner: Reforzando Meta-Agentes a Nivel de Consulta
FlowReasoner: Reinforcing Query-Level Meta-Agents
Hongcheng Gao, Yue Liu, Yufei He, Longxu Dou, Chao Du, Zhijie Deng, Bryan Hooi, Min Lin, Tianyu Pang
•
Apr 21, 2025
•
46
2
SilVar-Med: Un modelo de lenguaje visual impulsado por voz para la detección explicable de anomalías en imágenes médicas
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging
Tan-Hanh Pham, Chris Ngo, Trong-Duong Bui, Minh Luu Quang, Tan-Huong Pham, Truong-Son Hy
•
Apr 14, 2025
•
2
2
NEMOTRON-CROSSTHINK: Escalando el autoaprendizaje más allá del razonamiento matemático
NEMOTRON-CROSSTHINK: Scaling Self-Learning beyond Math Reasoning
Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov, Seungju Han, Ying Lin, Evelina Bakhturi, Eric Nyberg, Yejin Choi, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro
•
Apr 15, 2025
•
6
4
Eagle 2.5: Potenciamiento del Post-Entrenamiento de Contexto Largo para Modelos de Visión-Lenguaje de Vanguardia
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models
Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Tuomas Rintamaki, Tyler Poon, Max Ehrlich, Tuomas Rintamaki, Tyler Poon, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu
•
Apr 21, 2025
•
65
5
ToolRL: La Recompensa es Todo lo que el Aprendizaje de Herramientas Necesita
ToolRL: Reward is All Tool Learning Needs
Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji
•
Apr 16, 2025
•
41
2
DRAGON: Recompensas Distribucionales Optimizan Modelos Generativos de Difusión
DRAGON: Distributional Rewards Optimize Diffusion Generative Models
Yatong Bai, Jonah Casebeer, Somayeh Sojoudi, Nicholas J. Bryan
•
Apr 21, 2025
•
10
2
THOUGHTTERMINATOR: Evaluación, Calibración y Mitigación del Pensamiento Excesivo en Modelos de Razonamiento
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models
Xiao Pu, Michael Saxon, Wenyue Hua, William Yang Wang
•
Apr 17, 2025
•
24
2
Lanza los dados y mira antes de saltar: Ir más allá de los límites creativos de la predicción del siguiente token
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction
Vaishnavh Nagarajan, Chen Henry Wu, Charles Ding, Aditi Raghunathan
•
Apr 21, 2025
•
2
2
Aprendizaje del razonamiento bajo guía fuera de la política
Learning to Reason under Off-Policy Guidance
Jianhao Yan, Yafu Li, Zican Hu, Zhi Wang, Ganqu Cui, Xiaoye Qu, Yu Cheng, Yue Zhang
•
Apr 21, 2025
•
77
4
RainbowPlus: Mejora de la Generación de Prompts Adversariales mediante Búsqueda Evolutiva de Calidad-Diversidad
RainbowPlus: Enhancing Adversarial Prompt Generation via Evolutionary Quality-Diversity Search
Quy-Anh Dang, Chris Ngo, Truong-Son Hy
•
Apr 21, 2025
•
6
8
Un Modelo de Lenguaje Multimodal para la Comprensión Eficiente de Videos mediante la Compresión Reforzada de Cubos de Video
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes
Ji Qi, Yuan Yao, Yushi Bai, Bin Xu, Juanzi Li, Zhiyuan Liu, Tat-Seng Chua
•
Apr 21, 2025
•
10
3
LookingGlass: Anamorfosis Generativas mediante Deformación de Pirámide Laplaciana
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping
Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
•
Apr 11, 2025
•
8
6
X-Teaming: Jailbreaks de Múltiples Turnos y Defensas con Agentes Múltiples Adaptativos
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents
Salman Rahman, Liwei Jiang, James Shiffer, Genglin Liu, Sheriff Issaka, Md Rizwan Parvez, Hamid Palangi, Kai-Wei Chang, Yejin Choi, Saadia Gabriel
•
Apr 15, 2025
•
30
2
OTC: Llamadas Óptimas a Herramientas mediante Aprendizaje por Refuerzo
OTC: Optimal Tool Calls via Reinforcement Learning
Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji
•
Apr 21, 2025
•
33
2
SphereDiff: Generación Omnidireccional de Imágenes y Videos Panorámicos sin Ajustes mediante Representación Latente Esférica
SphereDiff: Tuning-free Omnidirectional Panoramic Image and Video Generation via Spherical Latent Representation
Minho Park, Taewoong Kang, Jooyeol Yun, Sungwon Hwang, Jaegul Choo
•
Apr 19, 2025
•
28
2
CoMotion: Movimiento 3D Concurrente para Múltiples Personas
CoMotion: Concurrent Multi-person 3D Motion
Alejandro Newell, Peiyun Hu, Lahav Lipson, Stephan R. Richter, Vladlen Koltun
•
Apr 16, 2025
•
3
2
UFO2: El Sistema Operativo de Agente de Escritorio
UFO2: The Desktop AgentOS
Chaoyun Zhang, He Huang, Chiming Ni, Jian Mu, Si Qin, Shilin He, Lu Wang, Fangkai Yang, Pu Zhao, Chao Du, Liqun Li, Yu Kang, Zhao Jiang, Suzhen Zheng, Rujia Wang, Jiaxu Qian, Minghua Ma, Jian-Guang Lou, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang
•
Apr 20, 2025
•
27
3
Uni3C: Unificación de Controles Precisos de Cámara Mejorada en 3D y Movimiento Humano para la Generación de Videos
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation
Chenjie Cao, Jingkai Zhou, Shikai Li, Jingyun Liang, Chaohui Yu, Fan Wang, Xiangyang Xue, Yanwei Fu
•
Apr 21, 2025
•
18
2
TAPIP3D: Seguimiento de Cualquier Punto en Geometría 3D Persistente
TAPIP3D: Tracking Any Point in Persistent 3D Geometry
Bowei Zhang, Lei Ke, Adam W. Harley, Katerina Fragkiadaki
•
Apr 20, 2025
•
7
2
LearnAct: Agente de GUI móvil con pocos ejemplos y un banco de pruebas unificado de demostraciones
LearnAct: Few-Shot Mobile GUI Agent with a Unified Demonstration Benchmark
Guangyi Liu, Pengxiang Zhao, Liang Liu, Zhiming Chen, Yuxiang Chai, Shuai Ren, Hao Wang, Shibo He, Wenchao Meng
•
Apr 18, 2025
•
11
2
StyleMe3D: Estilización con Priors Desenredados mediante Múltiples Codificadores sobre Gaussianas 3D
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians
Cailin Zhuang, Yaoqi Hu, Xuanyang Zhang, Wei Cheng, Jiacheng Bao, Shengqi Liu, Yiying Yang, Xianfang Zeng, Gang Yu, Ming Li
•
Apr 21, 2025
•
23
2
PROMPTEVALS: Un conjunto de datos de aserciones y salvaguardas para tuberías personalizadas de modelos de lenguaje de gran escala en producción
PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines
Reya Vir, Shreya Shankar, Harrison Chase, Will Fu-Hinthorn, Aditya Parameswaran
•
Apr 20, 2025
•
4
2