ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 1st, 2025
MoCha: Hacia la síntesis de personajes parlantes de calidad cinematográfica
MoCha: Towards Movie-Grade Talking Character Synthesis
Cong Wei, Bo Sun, Haoyu Ma, Ji Hou, Felix Juefei-Xu, Zecheng He, Xiaoliang Dai, Luxin Zhang, Kunpeng Li, Tingbo Hou, Animesh Sinha, Peter Vajda, Wenhu Chen
•
Mar 30, 2025
•
131
11
TextCrafter: Representación precisa de múltiples textos en escenas visuales complejas
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes
Nikai Du, Zhennan Chen, Zhizhou Chen, Shan Gao, Xi Chen, Zhengkai Jiang, Jian Yang, Ying Tai
•
Mar 30, 2025
•
95
3
Open-Reasoner-Zero: Un enfoque de código abierto para escalar el aprendizaje por refuerzo en el modelo base
Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model
Jingcheng Hu, Yinmin Zhang, Qi Han, Daxin Jiang, Xiangyu Zhang, Heung-Yeung Shum
•
Mar 31, 2025
•
63
3
¿Qué, Cómo, Dónde y Qué Tan Bien? Una Revisión sobre el Escalamiento en Tiempo de Prueba en Modelos de Lenguaje a Gran Escala
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models
Qiyuan Zhang, Fuyuan Lyu, Zexu Sun, Lei Wang, Weixu Zhang, Zhihan Guo, Yufei Wang, Irwin King, Xue Liu, Chen Ma
•
Mar 31, 2025
•
53
2
Inferencia Eficiente en Modelos de Razonamiento a Gran Escala: Una Revisión
Efficient Inference for Large Reasoning Models: A Survey
Yue Liu, Jiaying Wu, Yufei He, Hongcheng Gao, Hongyu Chen, Baolong Bi, Jiaheng Zhang, Zhiqi Huang, Bryan Hooi
•
Mar 29, 2025
•
46
3
TokenHSI: Síntesis Unificada de Interacciones Físicas entre Humanos y Escenas mediante Tokenización de Tareas
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
Liang Pan, Zeshi Yang, Zhiyang Dou, Wenjia Wang, Buzhen Huang, Bo Dai, Taku Komura, Jingbo Wang
•
Mar 25, 2025
•
39
3
Unicorn: Síntesis de Datos Solo de Texto para el Entrenamiento de Modelos de Lenguaje y Visión
Unicorn: Text-Only Data Synthesis for Vision Language Model Training
Xiaomin Yu, Pengxiang Ding, Wenjie Zhang, Siteng Huang, Songyang Gao, Chengwei Qin, Kejian Wu, Zhaoxin Fan, Ziyue Qiao, Donglin Wang
•
Mar 28, 2025
•
38
2
RIG: Sinergizando Razonamiento e Imaginación en Políticas Generalistas de Extremo a Extremo
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy
Zhonghan Zhao, Wenwei Zhang, Haian Huang, Kuikun Liu, Jianfei Gao, Gaoang Wang, Kai Chen
•
Mar 31, 2025
•
30
2
SketchVideo: Generación y Edición de Videos Basados en Bocetos
SketchVideo: Sketch-based Video Generation and Editing
Feng-Lin Liu, Hongbo Fu, Xintao Wang, Weicai Ye, Pengfei Wan, Di Zhang, Lin Gao
•
Mar 30, 2025
•
23
3
Control efectivo de modelos de razonamiento mediante intervención del pensamiento
Effectively Controlling Reasoning Models through Thinking Intervention
Tong Wu, Chong Xiang, Jiachen T. Wang, Prateek Mittal
•
Mar 31, 2025
•
19
4
Ampliando el Aprendizaje por Refuerzo con Recompensas Verificables en Diversos Dominios
Expanding RL with Verifiable Rewards Across Diverse Domains
Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong Yu
•
Mar 31, 2025
•
19
2
Consulta y Conquista: Generación de SQL Guiada por la Ejecución
Query and Conquer: Execution-Guided SQL Generation
Łukasz Borchmann, Marek Wydmuch
•
Mar 31, 2025
•
18
2
Distilación de Renderizado Progresivo: Adaptación de Stable Diffusion para la Generación Instantánea de Mallas a partir de Texto sin Datos 3D
Progressive Rendering Distillation: Adapting Stable Diffusion for Instant Text-to-Mesh Generation without 3D Data
Zhiyuan Ma, Xinyue Liang, Rongyuan Wu, Xiangyu Zhu, Zhen Lei, Lei Zhang
•
Mar 27, 2025
•
16
2
TeleAntiFraud-28k: Un conjunto de datos de pensamiento lento audio-texto para la detección de fraude en telecomunicaciones
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection
Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen Kang
•
Mar 31, 2025
•
12
2
ActionStudio: Un Marco Ligero para Datos y Entrenamiento de Modelos de Acción a Gran Escala
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models
Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong
•
Mar 28, 2025
•
12
2
Planificación Clásica con Heurísticas Generadas por LLM: Desafiando el Estado del Arte con Código en Python
Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code
Augusto B. Corrêa, André G. Pereira, Jendrik Seipp
•
Mar 24, 2025
•
10
1
AvatarArtist: Creación de Avatares 4D de Dominio Abierto
AvatarArtist: Open-Domain 4D Avatarization
Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen
•
Mar 25, 2025
•
9
2
Easi3R: Estimación de movimiento desenredado a partir de DUSt3R sin entrenamiento
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training
Xingyu Chen, Yue Chen, Yuliang Xiu, Andreas Geiger, Anpei Chen
•
Mar 31, 2025
•
7
2
MeshCraft: Explorando la Generación Eficiente y Controlable de Mallas con DiTs Basados en Flujos
MeshCraft: Exploring Efficient and Controllable Mesh Generation with Flow-based DiTs
Xianglong He, Junyi Chen, Di Huang, Zexiang Liu, Xiaoshui Huang, Wanli Ouyang, Chun Yuan, Yangguang Li
•
Mar 29, 2025
•
7
2
DSO: Alineando Generadores 3D con Retroalimentación de Simulación para Solidez Física
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness
Ruining Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi
•
Mar 28, 2025
•
6
2
UPME: Un Marco de Revisión por Pares No Supervisado para la Evaluación de Modelos de Lenguaje Multimodales a Gran Escala
UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation
Qihui Zhang, Munan Ning, Zheyuan Liu, Yanbo Wang, Jiayi Ye, Yue Huang, Shuo Yang, Xiao Chen, Yibing Song, Li Yuan
•
Mar 19, 2025
•
6
2
Ponderación Adaptativa Basada en Entropía para el Autoaprendizaje
Entropy-Based Adaptive Weighting for Self-Training
Xiaoxuan Wang, Yihe Deng, Mingyu Derek Ma, Wei Wang
•
Mar 31, 2025
•
4
2
KOFFVQA: Un punto de referencia de preguntas y respuestas visuales de forma libre evaluado objetivamente para modelos grandes de visión y lenguaje en el idioma coreano
KOFFVQA: An Objectively Evaluated Free-form VQA Benchmark for Large Vision-Language Models in the Korean Language
Yoonshik Kim, Jaeyoon Jung
•
Mar 31, 2025
•
4
2
Uniendo la Optimización Evolutiva Multiobjetivo y la Aceleración por GPU mediante Tensorización
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration via Tensorization
Zhenyu Liang, Hao Li, Naiwei Yu, Kebin Sun, Ran Cheng
•
Mar 26, 2025
•
4
3
PAVE: Parcheo y Adaptación de Modelos de Lenguaje de Gran Escala para Vídeo
PAVE: Patching and Adapting Video Large Language Models
Zhuoming Liu, Yiquan Li, Khoi Duc Nguyen, Yiwu Zhong, Yin Li
•
Mar 25, 2025
•
4
2
Desacoplamiento de Ángulos y Fuerza en la Adaptación de Bajo Rango
Decoupling Angles and Strength in Low-rank Adaptation
Massimo Bini, Leander Girrbach, Zeynep Akata
•
Mar 23, 2025
•
4
2
Comprensión de los gestos co-verbales en entornos naturales
Understanding Co-speech Gestures in-the-wild
Sindhu B Hegde, K R Prajwal, Taein Kwon, Andrew Zisserman
•
Mar 28, 2025
•
1
2