ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 3rd, 2025
AnimeGamer: Simulación Infinita de Vida Anime con Predicción del Siguiente Estado del Juego
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
Junhao Cheng, Yuying Ge, Yixiao Ge, Jing Liao, Ying Shan
•
Apr 1, 2025
•
66
2
LSNet: Ver en grande, enfocar en pequeño
LSNet: See Large, Focus Small
Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding
•
Mar 29, 2025
•
9
3
VerifiAgent: un Agente de Verificación Unificado en el Razonamiento de Modelos de Lenguaje
VerifiAgent: a Unified Verification Agent in Language Model Reasoning
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
•
Apr 1, 2025
•
6
2
Modelos de Difusión de Video Conscientes del Objetivo
Target-Aware Video Diffusion Models
Taeksoo Kim, Hanbyul Joo
•
Mar 24, 2025
•
5
2
MegaTTS 3: Transformador de Difusión Latente con Alineación Dispersa Mejorada para Síntesis de Voz en Cero-Shot
MegaTTS 3: Sparse Alignment Enhanced Latent Diffusion Transformer for Zero-Shot Speech Synthesis
Ziyue Jiang, Yi Ren, Ruiqi Li, Shengpeng Ji, Boyang Zhang, Zhenhui Ye, Chen Zhang, Bai Jionghao, Xiaoda Yang, Jialong Zuo, Yu Zhang, Rui Liu, Xiang Yin, Zhou Zhao
•
Feb 26, 2025
•
12
2
Mejora del Razonamiento Visoespacial mediante Entrenamiento Similar a R1-Zero
Improved Visual-Spatial Reasoning via R1-Zero-Like Training
Zhenyi Liao, Qingsong Xie, Yanhao Zhang, Zijian Kong, Haonan Lu, Zhenyu Yang, Zhijie Deng
•
Apr 1, 2025
•
62
3
MergeVQ: Un Marco Unificado para la Generación y Representación Visual con Fusión de Tokens Desenredada y Cuantización
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization
Siyuan Li, Luyuan Zhang, Zedong Wang, Juanxi Tian, Cheng Tan, Zicheng Liu, Chang Yu, Qingsong Xie, Haonan Lu, Haoqian Wang, Zhen Lei
•
Apr 1, 2025
•
87
7
Salto Adaptativo de Capas en LLMs Preentrenados
Adaptive Layer-skipping in Pre-trained LLMs
Xuan Luo, Weizhi Wang, Xifeng Yan
•
Mar 31, 2025
•
6
2
Comprensión del Entrenamiento Tipo R1-Cero: Una Perspectiva Crítica
Understanding R1-Zero-Like Training: A Critical Perspective
Zichen Liu, Changyu Chen, Wenjun Li, Penghui Qi, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin
•
Mar 26, 2025
•
47
3
ILLUME+: Iluminando MLLM Unificado con Tokenización Visual Dual y Refinamiento por Difusión
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement
Runhui Huang, Chunwei Wang, Junwei Yang, Guansong Lu, Yunlong Yuan, Jianhua Han, Lu Hou, Wei Zhang, Lanqing Hong, Hengshuang Zhao, Hang Xu
•
Apr 2, 2025
•
23
4
Los modelos de lenguaje grande en el ámbito médico se distraen con facilidad.
Medical large language models are easily distracted
Krithik Vishwanath, Anton Alyakin, Daniel Alexander Alber, Jin Vivian Lee, Douglas Kondziolka, Eric Karl Oermann
•
Apr 1, 2025
•
3
2
ScholarCopilot: Entrenamiento de Modelos de Lenguaje a Gran Escala para la Redacción Académica con Citaciones Precisas
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations
Yubo Wang, Xueguang Ma, Ping Nie, Huaye Zeng, Zhiheng Lyu, Yuxuan Zhang, Benjamin Schneider, Yi Lu, Xiang Yue, Wenhu Chen
•
Apr 1, 2025
•
40
2
VideoScene: Distilación de Modelos de Difusión de Video para Generar Escenas 3D en un Solo Paso
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step
Hanyang Wang, Fangfu Liu, Jiawei Chi, Yueqi Duan
•
Apr 2, 2025
•
40
2
DASH: Detección y Evaluación de Alucinaciones Sistemáticas en Modelos de Lenguaje Visual
DASH: Detection and Assessment of Systematic Hallucinations of VLMs
Maximilian Augustin, Yannic Neuhaus, Matthias Hein
•
Mar 30, 2025
•
12
2
Quamba2: Un marco robusto y escalable de cuantización posentrenamiento para modelos de espacio de estados selectivos
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models
Hung-Yueh Chiang, Chi-Chih Chang, Natalia Frumkin, Kai-Chiang Wu, Mohamed S. Abdelfattah, Diana Marculescu
•
Mar 28, 2025
•
10
2
Protección de Modelos Visión-Lenguaje: Mitigación de Vulnerabilidades al Ruido Gaussiano en Ataques Basados en Perturbaciones
Safeguarding Vision-Language Models: Mitigating Vulnerabilities to Gaussian Noise in Perturbation-based Attacks
Jiawei Wang, Yushen Zuo, Yuanjun Chai, Zhendong Liu, Yichen Fu, Yichun Feng, Kin-man Lam
•
Apr 2, 2025
•
13
2
PaperBench: Evaluando la capacidad de la IA para replicar investigaciones en IA
PaperBench: Evaluating AI's Ability to Replicate AI Research
Giulio Starace, Oliver Jaffe, Dane Sherburn, James Aung, Jun Shern Chan, Leon Maksin, Rachel Dias, Evan Mays, Benjamin Kinsella, Wyatt Thompson, Johannes Heidecke, Amelia Glaese, Tejal Patwardhan
•
Apr 2, 2025
•
36
2
Detección Mejorada de OoD mediante Alineación Intermodal de Representaciones Multimodales
Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations
Jeonghyeon Kim, Sangheum Hwang
•
Mar 24, 2025
•
4
1
Potencia tu propio modelo de generación de imágenes humanas mediante optimización directa de preferencias con retroalimentación de IA.
Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback
Sanghyeon Na, Yonggyu Kim, Hyunjoon Lee
•
May 30, 2024
•
22
3
Hacia la Generación de Vídeos Físicamente Plausibles mediante Planificación con Modelos de Lenguaje Visual
Towards Physically Plausible Video Generation via VLM Planning
Xindi Yang, Baolu Li, Yiming Zhang, Zhenfei Yin, Lei Bai, Liqian Ma, Zhiyong Wang, Jianfei Cai, Tien-Tsin Wong, Huchuan Lu, Xu Jia
•
Mar 30, 2025
•
39
3
DreamActor-M1: Animación de imágenes humanas holística, expresiva y robusta con guía híbrida
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
Yuxuan Luo, Zhengkun Rong, Lizhen Wang, Longhao Zhang, Tianshu Hu, Yongming Zhu
•
Apr 2, 2025
•
65
7
Distilación de Cinemática Articulada a partir de Modelos de Difusión de Video
Articulated Kinematics Distillation from Video Diffusion Models
Xuan Li, Qianli Ma, Tsung-Yi Lin, Yongxin Chen, Chenfanfu Jiang, Ming-Yu Liu, Donglai Xiang
•
Apr 1, 2025
•
24
3