ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
January 13th, 2025
Facilitando la supervisión escalable a través de un crítico auto-evolutivo.
Enabling Scalable Oversight via Self-Evolving Critic
Zhengyang Tang, Ziniu Li, Zhenyang Xiao, Tian Ding, Ruoyu Sun, Benyou Wang, Dayiheng Liu, Fei Huang, Tianyu Liu, Bowen Yu, Junyang Lin
•
Jan 10, 2025
•
75
2
VideoRAG: Generación con Recuperación Mejorada sobre un Corpus de Video
VideoRAG: Retrieval-Augmented Generation over Video Corpus
Soyeong Jeong, Kangsan Kim, Jinheon Baek, Sung Ju Hwang
•
Jan 10, 2025
•
72
6
LlamaV-o1: Repensando el Razonamiento Visual Paso a Paso en LLMs
LlamaV-o1: Rethinking Step-by-step Visual Reasoning in LLMs
Omkar Thawakar, Dinura Dissanayake, Ketan More, Ritesh Thawkar, Ahmed Heakl, Noor Ahsan, Yuhao Li, Mohammed Zumri, Jean Lahoud, Rao Muhammad Anwer, Hisham Cholakkal, Ivan Laptev, Mubarak Shah, Fahad Shahbaz Khan, Salman Khan
•
Jan 10, 2025
•
66
5
OmniManip: Hacia la Manipulación Robótica General a través de Primitivas de Interacción Centradas en Objetos como Restricciones Espaciales
OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives as Spatial Constraints
Mingjie Pan, Jiyao Zhang, Tianshu Wu, Yinghao Zhao, Wenlong Gao, Hao Dong
•
Jan 7, 2025
•
56
3
OVO-Bench: ¿Qué tan lejos están tus Modelos de Lenguaje de Video de la comprensión de videos en línea del mundo real?
OVO-Bench: How Far is Your Video-LLMs from Real-World Online Video Understanding?
Yifei Li, Junbo Niu, Ziyang Miao, Chunjiang Ge, Yuanhang Zhou, Qihao He, Xiaoyi Dong, Haodong Duan, Shuangrui Ding, Rui Qian, Pan Zhang, Yuhang Zang, Yuhang Cao, Conghui He, Jiaqi Wang
•
Jan 9, 2025
•
44
2
Migician: Revelando la Magia de la Fundamentación de Múltiples Imágenes en Formato Libre en Modelos de Lenguaje Multimodales de Gran Escala
Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models
You Li, Heyu Huang, Chi Chen, Kaiyu Huang, Chao Huang, Zonghao Guo, Zhiyuan Liu, Jinan Xu, Yuhua Li, Ruixuan Li, Maosong Sun
•
Jan 10, 2025
•
30
2
Ajuste fino multiagente: Mejora personal con Cadenas de Razonamiento Diversas
Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains
Vighnesh Subramaniam, Yilun Du, Joshua B. Tenenbaum, Antonio Torralba, Shuang Li, Igor Mordatch
•
Jan 10, 2025
•
20
2
ReFocus: Edición Visual como una Cadena de Pensamiento para la Comprensión Estructurada de Imágenes
ReFocus: Visual Editing as a Chain of Thought for Structured Image Understanding
Xingyu Fu, Minqian Liu, Zhengyuan Yang, John Corring, Yijuan Lu, Jianwei Yang, Dan Roth, Dinei Florencio, Cha Zhang
•
Jan 9, 2025
•
15
2
ConceptMaster: Personalización de Video Multi-Concepto en Modelos de Transformador de Difusión Sin Ajuste en Tiempo de Prueba
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning
Yuzhou Huang, Ziyang Yuan, Quande Liu, Qiulin Wang, Xintao Wang, Ruimao Zhang, Pengfei Wan, Di Zhang, Kun Gai
•
Jan 8, 2025
•
15
2
Personalización multi-sujeto de conjunto abierto en la generación de video
Multi-subject Open-set Personalization in Video Generation
Tsai-Shien Chen, Aliaksandr Siarohin, Willi Menapace, Yuwei Fang, Kwot Sin Lee, Ivan Skorokhodov, Kfir Aberman, Jun-Yan Zhu, Ming-Hsuan Yang, Sergey Tulyakov
•
Jan 10, 2025
•
14
2
Infectando la Inteligencia Artificial Generativa con Virus.
Infecting Generative AI With Viruses
David Noever, Forrest McKee
•
Jan 9, 2025
•
13
9
Inteligencia Artificial Generativa para Animación Cel: Un Estudio
Generative AI for Cel-Animation: A Survey
Yunlong Tang, Junjia Guo, Pinxin Liu, Zhiyuan Wang, Hang Hua, Jia-Xing Zhong, Yunzhong Xiao, Chao Huang, Luchuan Song, Susan Liang, Yizhi Song, Liu He, Jing Bi, Mingqian Feng, Xinyang Li, Zeliang Zhang, Chenliang Xu
•
Jan 8, 2025
•
13
2
Desmitificando el Post-entrenamiento Adaptativo de Dominio para Modelos de Lenguaje de Mercados Financieros
Demystifying Domain-adaptive Post-training for Financial LLMs
Zixuan Ke, Yifei Ming, Xuan-Phi Nguyen, Caiming Xiong, Shafiq Joty
•
Jan 9, 2025
•
11
2