ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
October 24th, 2024
LongVU: Compresión Adaptativa Espaciotemporal para la Comprensión de Video-Lenguaje Extenso
LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding
Xiaoqian Shen, Yunyang Xiong, Changsheng Zhao, Lemeng Wu, Jun Chen, Chenchen Zhu, Zechun Liu, Fanyi Xiao, Balakrishnan Varadarajan, Florian Bordes, Zhuang Liu, Hu Xu, Hyunwoo J. Kim, Bilge Soran, Raghuraman Krishnamoorthi, Mohamed Elhoseiny, Vikas Chandra
•
Oct 22, 2024
•
29
2
TP-Eval: Desbloquear el potencial de los LLMs Multimodales en la Evaluación mediante la Personalización de las Indicaciones
TP-Eval: Tap Multimodal LLMs' Potential in Evaluation by Customizing Prompts
Yuxuan Xie, Tianhua Li, Wenqi Shao, Kaipeng Zhang
•
Oct 23, 2024
•
7
1
WorldSimBench: Hacia Modelos de Generación de Video como Simuladores del Mundo
WorldSimBench: Towards Video Generation Models as World Simulators
Yiran Qin, Zhelun Shi, Jiwen Yu, Xijun Wang, Enshen Zhou, Lijun Li, Zhenfei Yin, Xihui Liu, Lu Sheng, Jing Shao, Lei Bai, Wanli Ouyang, Ruimao Zhang
•
Oct 23, 2024
•
20
2
M-RewardBench: Evaluando Modelos de Recompensa en Entornos Multilingües
M-RewardBench: Evaluating Reward Models in Multilingual Settings
Srishti Gureja, Lester James V. Miranda, Shayekh Bin Islam, Rishabh Maheshwary, Drishti Sharma, Gusti Winata, Nathan Lambert, Sebastian Ruder, Sara Hooker, Marzieh Fadaee
•
Oct 20, 2024
•
12
3
Escalando Modelos de Lenguaje de Difusión mediante Adaptación de Modelos Autoregresivos
Scaling Diffusion Language Models via Adaptation from Autoregressive Models
Shansan Gong, Shivam Agarwal, Yizhe Zhang, Jiacheng Ye, Lin Zheng, Mukai Li, Chenxin An, Peilin Zhao, Wei Bi, Jiawei Han, Hao Peng, Lingpeng Kong
•
Oct 23, 2024
•
16
2
MIA-DPO: Optimización de Preferencia Directa Aumentada de Múltiples Imágenes para Modelos de Visión-Lenguaje Grandes
MIA-DPO: Multi-Image Augmented Direct Preference Optimization For Large Vision-Language Models
Ziyu Liu, Yuhang Zang, Xiaoyi Dong, Pan Zhang, Yuhang Cao, Haodong Duan, Conghui He, Yuanjun Xiong, Dahua Lin, Jiaqi Wang
•
Oct 23, 2024
•
37
3
ARKit LabelMaker: Una Nueva Escala para la Comprensión de Escenas 3D en Interiores
ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding
Guangda Ji, Silvan Weder, Francis Engelmann, Marc Pollefeys, Hermann Blum
•
Oct 17, 2024
•
7
2
Optimización de Preferencias Clasificadas Escalable para la Generación de Texto a Imagen.
Scalable Ranked Preference Optimization for Text-to-Image Generation
Shyamgopal Karthik, Huseyin Coskun, Zeynep Akata, Sergey Tulyakov, Jian Ren, Anil Kag
•
Oct 23, 2024
•
15
2
Control de Aplicaciones Neuronales Livianas
Lightweight Neural App Control
Filippos Christianos, Georgios Papoudakis, Thomas Coste, Jianye Hao, Jun Wang, Kun Shao
•
Oct 23, 2024
•
10
2
MedINST: Metaconjunto de Datos de Instrucciones Biomédicas
MedINST: Meta Dataset of Biomedical Instructions
Wenhan Han, Meng Fang, Zihan Zhang, Yu Yin, Zirui Song, Ling Chen, Mykola Pechenizkiy, Qingyu Chen
•
Oct 17, 2024
•
7
2
Dirigiendo a tus Generalistas: Mejorando los Modelos Fundamentales de Robótica a través de la Orientación de Valor
Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance
Mitsuhiko Nakamoto, Oier Mees, Aviral Kumar, Sergey Levine
•
Oct 17, 2024
•
2
1
LVSM: Un Modelo de Síntesis de Gran Vista con un Mínimo Sesgo Inductivo 3D
LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias
Haian Jin, Hanwen Jiang, Hao Tan, Kai Zhang, Sai Bi, Tianyuan Zhang, Fujun Luan, Noah Snavely, Zexiang Xu
•
Oct 22, 2024
•
5
2
DynamicCity: Generación de LiDAR a Gran Escala a partir de Escenas Dinámicas
DynamicCity: Large-Scale LiDAR Generation from Dynamic Scenes
Hengwei Bian, Lingdong Kong, Haozhe Xie, Liang Pan, Yu Qiao, Ziwei Liu
•
Oct 23, 2024
•
14
2