ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
May 14th, 2024
¿Qué es importante al construir modelos de visión y lenguaje?
What matters when building vision-language models?
Hugo Laurençon, Léo Tronchon, Matthieu Cord, Victor Sanh
•
May 3, 2024
•
104
3
Flujo de trabajo de RLHF: Desde el modelado de recompensas hasta RLHF en línea
RLHF Workflow: From Reward Modeling to Online RLHF
Hanze Dong, Wei Xiong, Bo Pang, Haoxiang Wang, Han Zhao, Yingbo Zhou, Nan Jiang, Doyen Sahoo, Caiming Xiong, Tong Zhang
•
May 13, 2024
•
71
5
SUTRA: Arquitectura Escalable de Modelo de Lenguaje Multilingüe
SUTRA: Scalable Multilingual Language Model Architecture
Abhijit Bendale, Michael Sapienza, Steven Ripplinger, Simon Gibbs, Jaewon Lee, Pranav Mistry
•
May 7, 2024
•
40
2
SambaNova SN40L: Superando la barrera de memoria en IA con flujo de datos y composición de expertos
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts
Raghu Prabhakar, Ram Sivaramakrishnan, Darshan Gandhi, Yun Du, Mingran Wang, Xiangyu Song, Kejie Zhang, Tianren Gao, Angela Wang, Karen Li, Yongning Sheng, Joshua Brot, Denis Sokolov, Apurv Vivek, Calvin Leung, Arjun Sabnis, Jiayu Bai, Tuowen Zhao, Mark Gottscho, David Jackson, Mark Luttrell, Manish K. Shah, Edison Chen, Kaizhao Liang, Swayambhoo Jain, Urmish Thakker, Dawei Huang, Sumti Jairath, Kevin J. Brown, Kunle Olukotun
•
May 13, 2024
•
28
0
MS MARCO Web Search: un conjunto de datos web a gran escala y rico en información con millones de etiquetas de clics reales
MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels
Qi Chen, Xiubo Geng, Corby Rosset, Carolyn Buractaon, Jingwen Lu, Tao Shen, Kun Zhou, Chenyan Xiong, Yeyun Gong, Paul Bennett, Nick Craswell, Xing Xie, Fan Yang, Bryan Tower, Nikhil Rao, Anlei Dong, Wenqi Jiang, Zheng Liu, Mingqin Li, Chuanjie Liu, Zengzhong Li, Rangan Majumder, Jennifer Neville, Andy Oakley, Knut Magne Risvik, Harsha Vardhan Simhadri, Manik Varma, Yujing Wang, Linjun Yang, Mao Yang, Ce Zhang
•
May 13, 2024
•
22
1
Plot2Code: Un punto de referencia integral para evaluar modelos de lenguaje multimodal de gran escala en la generación de código a partir de gráficos científicos
Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots
Chengyue Wu, Yixiao Ge, Qiushan Guo, Jiahao Wang, Zhixuan Liang, Zeyu Lu, Ying Shan, Ping Luo
•
May 13, 2024
•
21
4
Piccolo2: Incrustación de Texto General con Entrenamiento de Pérdida Híbrida Multi-tarea
Piccolo2: General Text Embedding with Multi-task Hybrid Loss Training
Junqin Huang, Zhongjie Hu, Zihao Jing, Mengya Gao, Yichao Wu
•
May 11, 2024
•
21
1
LogoMotion: Generación de código visualmente fundamentado para animación consciente del contenido
LogoMotion: Visually Grounded Code Generation for Content-Aware Animation
Vivian Liu, Rubaiat Habib Kazi, Li-Yi Wei, Matthew Fisher, Timothy Langlois, Seth Walker, Lydia Chilton
•
May 11, 2024
•
19
2
Modelos de Lenguaje a Gran Escala como Generadores de Dominios de Planificación
Large Language Models as Planning Domain Generators
James Oswald, Kavitha Srinivas, Harsha Kokel, Junkyu Lee, Michael Katz, Shirin Sohrabi
•
Apr 2, 2024
•
14
2