ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
March 31st, 2025
Piensa antes de recomendar: Liberando el poder latente del razonamiento para la recomendación secuencial
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation
Jiakai Tang, Sunhao Dai, Teng Shi, Jun Xu, Xu Chen, Wen Chen, Wu Jian, Yuning Jiang
•
Mar 28, 2025
•
35
2
Generación de Cabezas Parlantes 3D con Precisión Perceptual: Nuevas Definiciones, Representación Speech-Mesh y Métricas de Evaluación
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics
Lee Chae-Yeon, Oh Hyun-Bin, Han EunGi, Kim Sung-Bin, Suekyeong Nam, Tae-Hyun Oh
•
Mar 26, 2025
•
22
3
MedAgent-Pro: Hacia un diagnóstico médico basado en evidencia multimodal mediante flujos de trabajo de agentes de razonamiento
MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow
Ziyue Wang, Junde Wu, Chang Han Low, Yueming Jin
•
Mar 21, 2025
•
6
2
ORIGEN: Fundamentación de Orientación 3D en Cero Disparos para la Generación de Imágenes a partir de Texto
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation
Yunhong Min, Daehyeon Choi, Kyeongmin Yeo, Jihyun Lee, Minhyuk Sung
•
Mar 28, 2025
•
24
3
Explorando las tendencias y efectos del escalado de datos en el aprendizaje por refuerzo a partir de retroalimentación humana
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback
Wei Shen, Guanlin Liu, Zheng Wu, Ruofei Zhu, Qingping Yang, Chao Xin, Yu Yue, Lin Yan
•
Mar 28, 2025
•
44
2
FÍSICA: Evaluación de Modelos Fundacionales en la Resolución de Problemas de Física a Nivel Universitario
PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving
Kaiyue Feng, Yilun Zhao, Yixin Liu, Tianyu Yang, Chen Zhao, John Sous, Arman Cohan
•
Mar 26, 2025
•
17
2
Reconstrucción de Humanos con un Esqueleto Biomecánicamente Preciso
Reconstructing Humans with a Biomechanically Accurate Skeleton
Yan Xia, Xiaowei Zhou, Etienne Vouga, Qixing Huang, Georgios Pavlakos
•
Mar 27, 2025
•
9
2
Una Revisión del Razonamiento Eficiente para Modelos de Razonamiento a Gran Escala: Lenguaje, Multimodalidad y Más Allá
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
Xiaoye Qu, Yafu Li, Zhaochen Su, Weigao Sun, Jianhao Yan, Dongrui Liu, Ganqu Cui, Daizong Liu, Shuxian Liang, Junxian He, Peng Li, Wei Wei, Jing Shao, Chaochao Lu, Yue Zhang, Xian-Sheng Hua, Bowen Zhou, Yu Cheng
•
Mar 27, 2025
•
39
4
Tu ViT es en secreto un modelo de segmentación de imágenes
Your ViT is Secretly an Image Segmentation Model
Tommie Kerssies, Niccolò Cavagnero, Alexander Hermans, Narges Norouzi, Giuseppe Averta, Bastian Leibe, Gijs Dubbelman, Daan de Geus
•
Mar 24, 2025
•
21
2
Hi3DGen: Generación de geometría 3D de alta fidelidad a partir de imágenes mediante puenteo de normales
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han
•
Mar 28, 2025
•
11
2
Desafíos y Caminos hacia la IA para la Ingeniería de Software
Challenges and Paths Towards AI for Software Engineering
Alex Gu, Naman Jain, Wen-Ding Li, Manish Shetty, Yijia Shao, Ziyang Li, Diyi Yang, Kevin Ellis, Koushik Sen, Armando Solar-Lezama
•
Mar 28, 2025
•
4
2
OThink-MR1: Estimulación de capacidades de razonamiento generalizado multimodal mediante aprendizaje por refuerzo dinámico
OThink-MR1: Stimulating multimodal generalized reasoning capabilities via dynamic reinforcement learning
Zhiyuan Liu, Yuting Zhang, Feng Liu, Changwang Zhang, Ying Sun, Jun Wang
•
Mar 20, 2025
•
26
3
AdaptiVocab: Mejorando la Eficiencia de los Modelos de Lenguaje de Gran Escala en Dominios Específicos mediante Adaptación Ligera de Vocabulario
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation
Itay Nakash, Nitay Calderon, Eyal Ben David, Elad Hoffer, Roi Reichart
•
Mar 25, 2025
•
75
2
SparseFlex: Modelado de Formas 3D de Alta Resolución y Topología Arbitraria
SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling
Xianglong He, Zi-Xin Zou, Chia-Hao Chen, Yuan-Chen Guo, Ding Liang, Chun Yuan, Wanli Ouyang, Yan-Pei Cao, Yangguang Li
•
Mar 27, 2025
•
9
2
Un Análisis Refinado de Activaciones Masivas en Modelos de Lenguaje de Gran Escala
A Refined Analysis of Massive Activations in LLMs
Louis Owen, Nilabhra Roy Chowdhury, Abhay Kumar, Fabian Güra
•
Mar 28, 2025
•
14
3
Zero4D: Generación de videos 4D sin entrenamiento a partir de un solo video utilizando un modelo de difusión de video estándar.
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion Model
Jangho Park, Taesung Kwon, Jong Chul Ye
•
Mar 28, 2025
•
18
2
Segmentar Cualquier Movimiento en Videos
Segment Any Motion in Videos
Nan Huang, Wenzhao Zheng, Chenfeng Xu, Kurt Keutzer, Shanghang Zhang, Angjoo Kanazawa, Qianqian Wang
•
Mar 28, 2025
•
17
2
ReFeed: Refinamiento de Resúmenes Multidimensionales con Razonamiento Reflexivo sobre Retroalimentación
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
•
Mar 27, 2025
•
20
3
SWI: Hablar con Intención en Modelos de Lenguaje a Gran Escala
SWI: Speaking with Intent in Large Language Models
Yuwei Yin, EunJeong Hwang, Giuseppe Carenini
•
Mar 27, 2025
•
2
2
Free4D: Generación de Escenas 4D sin Ajustes con Consistencia Espacio-Temporal
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency
Tianqi Liu, Zihao Huang, Zhaoxi Chen, Guangcong Wang, Shoukang Hu, Liao Shen, Huiqiang Sun, Zhiguo Cao, Wei Li, Ziwei Liu
•
Mar 26, 2025
•
21
2
X^{2}-Gaussiano: Representación Gaussiana Radiante 4D para la Reconstrucción Tomográfica en Tiempo Continuo
X^{2}-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction
Weihao Yu, Yuanhao Cai, Ruyi Zha, Zhiwen Fan, Chenxin Li, Yixuan Yuan
•
Mar 27, 2025
•
3
2
4D-Bench: Evaluación de Modelos de Lenguaje Multimodales de Gran Escala para la Comprensión de Objetos en 4D
4D-Bench: Benchmarking Multi-modal Large Language Models for 4D Object Understanding
Wenxuan Zhu, Bing Li, Cheng Zheng, Jinjie Mai, Jun Chen, Letian Jiang, Abdullah Hamdi, Sara Rojas Martinez, Chia-Wen Lin, Mohamed Elhoseiny, Bernard Ghanem
•
Mar 22, 2025
•
8
3
Sobre los Modelos Multimodales de Gran Escala como Clasificadores de Imágenes de Mundo Abierto
On Large Multimodal Models as Open-World Image Classifiers
Alessandro Conti, Massimiliano Mancini, Enrico Fini, Yiming Wang, Paolo Rota, Elisa Ricci
•
Mar 27, 2025
•
5
2