ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
April 15th, 2025
SocioVerse: Un Modelo de Mundo para Simulación Social Impulsado por Agentes de LLM y un Grupo de 10 Millones de Usuarios del Mundo Real
SocioVerse: A World Model for Social Simulation Powered by LLM Agents and A Pool of 10 Million Real-World Users
Xinnong Zhang, Jiayu Lin, Xinyi Mou, Shiyue Yang, Xiawei Liu, Libo Sun, Hanjia Lyu, Yihang Yang, Weihong Qi, Yue Chen, Guanying Li, Ling Yan, Yao Hu, Siming Chen, Yu Wang, Jingxuan Huang, Jiebo Luo, Shiping Tang, Libo Wu, Baohua Zhou, Zhongyu Wei
•
Apr 14, 2025
•
16
3
TinyLLaVA-Video-R1: Hacia modelos de lenguaje multimodal más pequeños para razonamiento en video
TinyLLaVA-Video-R1: Towards Smaller LMMs for Video Reasoning
Xingjian Zhang, Siwei Wen, Wenjun Wu, Lei Huang
•
Apr 13, 2025
•
16
3
¿Hemos unificado la generación y comprensión de imágenes? Un estudio empírico sobre la capacidad de generación de imágenes de GPT-4o
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability
Ning Li, Jingran Zhang, Justin Cui
•
Apr 9, 2025
•
49
2
PRIMA.CPP: Aceleración de la inferencia de modelos de lenguaje a escala de 70B en clústeres domésticos de bajos recursos
PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters
Zonghang Li, Tao Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Apr 7, 2025
•
126
7
Mavors: Representación de Video Multigranular para Modelos de Lenguaje Multimodal a Gran Escala
Mavors: Multi-granularity Video Representation for Multimodal Large Language Model
Yang Shi, Jiaheng Liu, Yushuo Guan, Zhenhua Wu, Yuanxing Zhang, Zihao Wang, Weihong Lin, Jingyun Hua, Zekun Wang, Xinlong Chen, Bohan Zeng, Wentao Zhang, Fuzheng Zhang, Wenjing Yang, Di Zhang
•
Apr 14, 2025
•
30
2
Entrenamiento Autosupervisado Iterativo para Generación de Código mediante Reordenación Reforzada
Iterative Self-Training for Code Generation via Reinforced Re-Ranking
Nikita Sorokin, Ivan Sedykh, Valentin Malykh
•
Apr 13, 2025
•
34
2
DUMP: Aprendizaje Automatizado de Plan de Estudios a Nivel de Distribución para Entrenamiento Posterior de LLM Basados en RL
DUMP: Automated Distribution-Level Curriculum Learning for RL-based LLM Post-training
Zhenting Wang, Guofeng Cui, Kun Wan, Wentian Zhao
•
Apr 13, 2025
•
19
2
VisuoThink: Potenciando el razonamiento de LVLM mediante búsqueda en árbol multimodal
VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search
Yikun Wang, Siyin Wang, Qinyuan Cheng, Zhaoye Fei, Liang Ding, Qipeng Guo, Dacheng Tao, Xipeng Qiu
•
Apr 12, 2025
•
12
4
FUSION: Integración Completa de Representaciones Visión-Lenguaje para una Comprensión Profunda Transmodal
FUSION: Fully Integration of Vision-Language Representations for Deep Cross-Modal Understanding
Zheng Liu, Mengjie Liu, Jingzhou Chen, Jingwei Xu, Bin Cui, Conghui He, Wentao Zhang
•
Apr 14, 2025
•
38
3
AgentRewardBench: Evaluación de Métricas Automáticas para Trayectorias de Agentes Web
AgentRewardBench: Evaluating Automatic Evaluations of Web Agent Trajectories
Xing Han Lù, Amirhossein Kazemnejad, Nicholas Meade, Arkil Patel, Dongchan Shin, Alejandra Zambrano, Karolina Stańczak, Peter Shaw, Christopher J. Pal, Siva Reddy
•
Apr 11, 2025
•
27
2
Cómo los nuevos datos se integran en el conocimiento de los LLM y cómo diluirlos
How new data permeates LLM knowledge and how to dilute it
Chen Sun, Renat Aksitov, Andrey Zhmoginov, Nolan Andrew Miller, Max Vladymyrov, Ulrich Rueckert, Been Kim, Mark Sandler
•
Apr 13, 2025
•
7
2
VL-Rethinker: Incentivizando la Autorreflexión en Modelos de Visión-Lenguaje con Aprendizaje por Refuerzo
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning
Haozhe Wang, Chao Qu, Zuming Huang, Wei Chu, Fangzhen Lin, Wenhu Chen
•
Apr 10, 2025
•
42
2
Los Modelos de Lenguaje de Gran Escala Pueden Ser Persuasores Peligrosos: Estudio Empírico sobre la Seguridad de la Persuasión en Modelos de Lenguaje de Gran Escala
LLM Can be a Dangerous Persuader: Empirical Study of Persuasion Safety in Large Language Models
Minqian Liu, Zhiyang Xu, Xinyi Zhang, Heajun An, Sarvech Qadir, Qi Zhang, Pamela J. Wisniewski, Jin-Hee Cho, Sang Won Lee, Ruoxi Jia, Lifu Huang
•
Apr 14, 2025
•
4
2
3D CoCa: Los Modelos de Aprendizaje por Contraste son Generadores de Descripciones 3D
3D CoCa: Contrastive Learners are 3D Captioners
Ting Huang, Zeyu Zhang, Yemin Wang, Hao Tang
•
Apr 13, 2025
•
5
2
LLM-SRBench: Un nuevo punto de referencia para el descubrimiento de ecuaciones científicas con modelos de lenguaje de gran escala
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models
Parshin Shojaee, Ngoc-Hieu Nguyen, Kazem Meidani, Amir Barati Farimani, Khoa D Doan, Chandan K Reddy
•
Apr 14, 2025
•
8
2
MDK12-Bench: Un punto de referencia multidisciplinario para evaluar el razonamiento en modelos de lenguaje multimodal de gran escala
MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models
Pengfei Zhou, Fanrui Zhang, Xiaopeng Peng, Zhaopan Xu, Jiaxin Ai, Yansheng Qiu, Chuanhao Li, Zhen Li, Ming Li, Yukang Feng, Jianwen Sun, Haoquan Zhang, Zizhen Li, Xiaofeng Mao, Wangbo Zhao, Kai Wang, Xiaojun Chang, Wenqi Shao, Yang You, Kaipeng Zhang
•
Apr 8, 2025
•
4
2
M1: Hacia un cómputo escalable en tiempo de prueba con modelos de razonamiento Mamba
M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models
Junxiong Wang, Wen-Ding Li, Daniele Paliotta, Daniel Ritter, Alexander M. Rush, Tri Dao
•
Apr 14, 2025
•
10
2
MIEB: Punto de Referencia para la Incrustación Masiva de Imágenes
MIEB: Massive Image Embedding Benchmark
Chenghao Xiao, Isaac Chung, Imene Kerboua, Jamie Stirling, Xin Zhang, Márton Kardos, Roman Solomatin, Noura Al Moubayed, Kenneth Enevoldsen, Niklas Muennighoff
•
Apr 14, 2025
•
16
2
InternVL3: Exploración de técnicas avanzadas de entrenamiento y estrategias en tiempo de prueba para modelos multimodales de código abierto
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models
Jinguo Zhu, Weiyun Wang, Zhe Chen, Zhaoyang Liu, Shenglong Ye, Lixin Gu, Yuchen Duan, Hao Tian, Weijie Su, Jie Shao, Zhangwei Gao, Erfei Cui, Yue Cao, Yangzhou Liu, Weiye Xu, Hao Li, Jiahao Wang, Han Lv, Dengnian Chen, Songze Li, Yinan He, Tan Jiang, Jiapeng Luo, Yi Wang, Conghui He, Botian Shi, Xingcheng Zhang, Wenqi Shao, Junjun He, Yingtong Xiong, Wenwen Qu, Peng Sun, Penglong Jiao, Lijun Wu, Kaipeng Zhang, Huipeng Deng, Jiaye Ge, Kai Chen, Limin Wang, Min Dou, Lewei Lu, Xizhou Zhu, Tong Lu, Dahua Lin, Yu Qiao, Jifeng Dai, Wenhai Wang
•
Apr 14, 2025
•
250
8
DeepSeek vs. o3-mini: ¿Qué tan bien pueden los LLMs de razonamiento evaluar la traducción automática y la generación de resúmenes?
DeepSeek vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization?
Daniil Larionov, Sotaro Takeshita, Ran Zhang, Yanran Chen, Christoph Leiter, Zhipin Wang, Christian Greisinger, Steffen Eger
•
Apr 10, 2025
•
4
2
Los modelos de razonamiento pueden ser efectivos sin necesidad de pensar.
Reasoning Models Can Be Effective Without Thinking
Wenjie Ma, Jingxuan He, Charlie Snell, Tyler Griggs, Sewon Min, Matei Zaharia
•
Apr 14, 2025
•
10
2
S1-Bench: Un Benchmark Simple para Evaluar la Capacidad de Pensamiento del Sistema 1 en Modelos de Razonamiento a Gran Escala
S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models
Wenyuan Zhang, Shuaiyi Nie, Xinghua Zhang, Zefeng Zhang, Tingwen Liu
•
Apr 14, 2025
•
21
3
Abstracciones Funcionales Ejecutables: Inferencia de Programas Generativos para Problemas Matemáticos Avanzados
Executable Functional Abstractions: Inferring Generative Programs for Advanced Math Problems
Zaid Khan, Elias Stengel-Eskin, Archiki Prasad, Jaemin Cho, Mohit Bansal
•
Apr 14, 2025
•
13
2
Rompiendo la Barrera de los Datos -- Construyendo Agentes de Interfaz Gráfica mediante la Generalización de Tareas
Breaking the Data Barrier -- Building GUI Agents Through Task Generalization
Junlei Zhang, Zichen Ding, Chang Ma, Zijie Chen, Qiushi Sun, Zhenzhong Lan, Junxian He
•
Apr 14, 2025
•
17
2
EmoAgent: Evaluación y Protección de la Interacción Humano-IA para la Seguridad en Salud Mental
EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety
Jiahao Qiu, Yinghui He, Xinzhe Juan, Yiming Wang, Yuhan Liu, Zixin Yao, Yue Wu, Xun Jiang, Ling Yang, Mengdi Wang
•
Apr 13, 2025
•
7
3
DiffuMural: Restauración de murales de Dunhuang con difusión multi-escala
DiffuMural: Restoring Dunhuang Murals with Multi-scale Diffusion
Puyu Han, Jiaju Kang, Yuhang Pan, Erting Pan, Zeyu Zhang, Qunchao Jin, Juntao Jiang, Zhichen Liu, Luqi Gong
•
Apr 13, 2025
•
1
2
Auditoría de Seguridad MCP: Los Modelos de Lenguaje con el Protocolo de Contexto del Modelo Permiten Explotaciones de Seguridad Graves
MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits
Brandon Radosevich, John Halloran
•
Apr 2, 2025
•
3
2
El Científico de IA-v2: Descubrimiento Científico Automatizado a Nivel de Taller mediante Búsqueda Arbórea Agéntica
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search
Yutaro Yamada, Robert Tjarko Lange, Cong Lu, Shengran Hu, Chris Lu, Jakob Foerster, Jeff Clune, David Ha
•
Apr 10, 2025
•
11
2