ChatPaper.aiChatPaper.ai
Inicio

arXiv

HuggingFace

PreciosCuentaEspacio de trabajo

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Artículos de Investigación en IA Diarios

Artículos de investigación en IA seleccionados diariamente con traducciones

¿Seguirá siendo cierto mañana? Clasificación de preguntas perennes multilingües para mejorar la confiabilidad en sistemas de preguntas y respuestas
Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Sergey Pletenev, Maria Marina, Nikolay Ivanov, Daria Galimzianova, Nikita Krayko, Mikhail Salnikov, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii•May 27, 2025•1114

Aprovechando la Autoatención para la Inducción de Preguntas Suaves Dependientes de la Entrada en Modelos de Lenguaje de Gran Escala
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs

Ananth Muppidi, Abhilash Nandy, Sambaran Bandyopadhyay•Jun 5, 2025•321

MORSE-500: Un punto de referencia de video controlable programáticamente para evaluar el razonamiento multimodal bajo estrés
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Zikui Cai, Andrew Wang, Anirudh Satheesh, Ankit Nakhawa, Hyunwoo Jae, Keenan Powell, Minghui Liu, Neel Jay, Sungbin Oh, Xiyao Wang, Yongyuan Liang, Tom Goldstein, Furong Huang•Jun 5, 2025•311

FusionAudio-1.2M: Hacia la descripción de audio detallada con fusión contextual multimodal
FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

Shunian Chen, Xinyuan Xie, Zheshu Chen, Liyan Zhao, Owen Lee, Zhan Su, Qilin Sun, Benyou Wang•Jun 1, 2025•292

PartCrafter: Generación Estructurada de Mallas 3D mediante Transformadores de Difusión Latente Composicional
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Yuchen Lin, Chenguo Lin, Panwang Pan, Honglei Yan, Yiqiang Feng, Yadong Mu, Katerina Fragkiadaki•Jun 5, 2025•282

Sentinel: Modelo de última generación para protegerse contra inyecciones de prompts
Sentinel: SOTA model to protect against prompt injections

Dror Ivry, Oran Nahum•Jun 5, 2025•211

La verdad en los pocos: selección de datos de alto valor para un razonamiento multimodal eficiente
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning

Shenshen Li, Kaiyuan Deng, Lei Wang, Hao Yang, Chong Peng, Peng Yan, Fumin Shen, Heng Tao Shen, Xing Xu•Jun 5, 2025•201

¿Es la Extensión de la Modalidad el Camino Correcto hacia la Omni-Modalidad?
Is Extending Modality The Right Path Towards Omni-Modality?

Tinghui Zhu, Kai Zhang, Muhao Chen, Yu Su•Jun 2, 2025•192

STARFlow: Escalando Flujos Normalizadores Latentes para la Síntesis de Imágenes de Alta Resolución
STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

Jiatao Gu, Tianrong Chen, David Berthelot, Huangjie Zheng, Yuyang Wang, Ruixiang Zhang, Laurent Dinh, Miguel Angel Bautista, Josh Susskind, Shuangfei Zhai•Jun 6, 2025•181

Modelos de Lenguaje de Gran Escala Conscientes del Audio como Evaluadores de Estilos de Habla
Audio-Aware Large Language Models as Judges for Speaking Styles

Cheng-Han Chiang, Xiaofei Wang, Chung-Ching Lin, Kevin Lin, Linjie Li, Radu Kopetz, Yao Qian, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang•Jun 6, 2025•143

Modelo de Mundo Médico: Simulación Generativa de la Evolución de Tumores para la Planificación de Tratamientos
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning

Yijun Yang, Zhao-Yang Wang, Qiuping Liu, Shuwen Sun, Kang Wang, Rama Chellappa, Zongwei Zhou, Alan Yuille, Lei Zhu, Yu-Dong Zhang, Jieneng Chen•Jun 2, 2025•132

CodeContests+: Generación de Casos de Prueba de Alta Calidad para Programación Competitiva
CodeContests+: High-Quality Test Case Generation for Competitive Programming

Zihan Wang, Siyao Liu, Yang Sun, Hongyan Li, Kai Shen•Jun 6, 2025•81

Precisión Clasificada por Pares: Creación de un Conjunto de Datos Fundamental para el Ajuste Fino de Modelos de Visión a partir de Imágenes Anotadas de DataSeeds
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery

Sajjad Abdoli, Freeman Lewin, Gediminas Vasiliauskas, Fabian Schonholz•Jun 6, 2025•81

Uniendo perspectivas: Una revisión sobre la inteligencia colaborativa entre vistas con visión egocéntrica y exocéntrica
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision

Yuping He, Yifei Huang, Guo Chen, Lidong Lu, Baoqi Pei, Jilan Xu, Tong Lu, Yoichi Sato•Jun 6, 2025•61

Proyección de Escenas Físicas: De lo Real a lo Simulado de Extremo a Extremo a partir de Datos Imperfectos de Robots
Splatting Physical Scenes: End-to-End Real-to-Sim from Imperfect Robot Data

Ben Moran, Mauro Comi, Steven Bohez, Tom Erez, Zhibin Li, Leonard Hasenclever•Jun 4, 2025•62

3DFlowAction: Aprendizaje de Manipulación Multi-Embodiment a partir del Mundo de Flujo 3D
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model

Hongyan Zhi, Peihao Chen, Siyuan Zhou, Yubo Dong, Quanxi Wu, Lei Han, Mingkui Tan•Jun 6, 2025•51

MIRIAD: Aumento de los LLM con millones de pares de consulta-respuesta médica
MIRIAD: Augmenting LLMs with millions of medical query-response pairs

Qinyue Zheng, Salman Abdullah, Sam Rawal, Cyril Zakka, Sophie Ostmeier, Maximilian Purk, Eduardo Reis, Eric J. Topol, Jure Leskovec, Michael Moor•Jun 6, 2025•51

HASHIRU: Sistema de Agentes Jerárquicos para la Utilización Híbrida e Inteligente de Recursos
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Kunal Pai, Parth Shah, Harshil Patel•Jun 1, 2025•51

Agrupador de Prefijos: Entrenamiento Eficiente de GRPO mediante Propagación hacia Adelante de Prefijos Compartidos
Prefix Grouper: Efficient GRPO Training through Shared-Prefix Forward

Zikang Liu, Tongtian Yue, Yepeng Tang, Longteng Guo, Junxian Cai, Qingbin Liu, Xi Chen, Jing Liu•Jun 5, 2025•41

Cuando los modelos saben más de lo que pueden explicar: Cuantificación de la transferencia de conocimiento en la colaboración humano-IA
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Quan Shi, Carlos E. Jimenez, Shunyu Yao, Nick Haber, Diyi Yang, Karthik Narasimhan•Jun 5, 2025•31

Cuando la Semántica Engaña a la Visión: Mitigación de Alucinaciones en Modelos Multimodales Grandes para la Detección y Comprensión de Texto en Escenas
When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu, Yan Zhang, Gangyan Zeng, Yan Li, Yu Zhou, Ser-Nam Lim, Harry Yang, Nicu Sebe•Jun 5, 2025•31

GuideX: Generación Guiada de Datos Sintéticos para la Extracción de Información con Enfoque de Cero Disparos
GuideX: Guided Synthetic Data Generation for Zero-Shot Information Extraction

Neil De La Fuente, Oscar Sainz, Iker García-Ferrero, Eneko Agirre•May 31, 2025•32

AssetOpsBench: Evaluación de Agentes de IA para la Automatización de Tareas en Operaciones y Mantenimiento de Activos Industriales
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance

Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam•Jun 4, 2025•12

Los Modelos de Espacio de Estados Esparsificados son Redes de Carreteras Eficientes.
Sparsified State-Space Models are Efficient Highway Networks

Woomin Song, Jihoon Tack, Sangwoo Mo, Seunghyuk Oh, Jinwoo Shin•May 27, 2025•12