ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
June 10th, 2024
La Mezcla-de-Agentes Potencia las Capacidades de los Modelos de Lenguaje de Gran Escala
Mixture-of-Agents Enhances Large Language Model Capabilities
Junlin Wang, Jue Wang, Ben Athiwaratkun, Ce Zhang, James Zou
•
Jun 7, 2024
•
60
3
CRAG -- Evaluación Integral de RAG (Recuperación Aumentada por Generación)
CRAG -- Comprehensive RAG Benchmark
Xiao Yang, Kai Sun, Hao Xin, Yushi Sun, Nikita Bhalla, Xiangsen Chen, Sajal Choudhary, Rongze Daniel Gui, Ziran Will Jiang, Ziyu Jiang, Lingkun Kong, Brian Moran, Jiaqi Wang, Yifan Ethan Xu, An Yan, Chenyu Yang, Eting Yuan, Hanwen Zha, Nan Tang, Lei Chen, Nicolas Scheffer, Yue Liu, Nirav Shah, Rakesh Wanga, Anuj Kumar, Wen-tau Yih, Xin Luna Dong
•
Jun 7, 2024
•
49
7
WildBench: Evaluando Modelos de Lenguaje con Tareas Desafiantes de Usuarios Reales en Entornos Naturales
WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in the Wild
Bill Yuchen Lin, Yuntian Deng, Khyathi Chandu, Faeze Brahman, Abhilasha Ravichander, Valentina Pyatkin, Nouha Dziri, Ronan Le Bras, Yejin Choi
•
Jun 7, 2024
•
31
1
GenAI Arena: Una Plataforma Abierta de Evaluación para Modelos Generativos
GenAI Arena: An Open Evaluation Platform for Generative Models
Dongfu Jiang, Max Ku, Tianle Li, Yuansheng Ni, Shizhuo Sun, Rongqi Fan, Wenhu Chen
•
Jun 6, 2024
•
23
0
Estimación de la Confianza en Modelos de Lenguaje de Gran Escala mediante Acceso de Caja Negra
Large Language Model Confidence Estimation via Black-Box Access
Tejaswini Pedapati, Amit Dhurandhar, Soumya Ghosh, Soham Dan, Prasanna Sattigeri
•
Jun 1, 2024
•
23
0
Corrección: Soluciona todos los errores con un solo toque.
Proofread: Fixes All Errors with One Tap
Renjie Liu, Yanxiang Zhang, Yun Zhu, Haicheng Sun, Yuanbo Zhang, Michael Xuelin Huang, Shanqing Cai, Lei Meng, Shumin Zhai
•
Jun 6, 2024
•
15
0
PLANIFICACIÓN NATURAL: Evaluación de Modelos de Lenguaje en Planificación de Lenguaje Natural
NATURAL PLAN: Benchmarking LLMs on Natural Language Planning
Huaixiu Steven Zheng, Swaroop Mishra, Hugh Zhang, Xinyun Chen, Minmin Chen, Azade Nova, Le Hou, Heng-Tze Cheng, Quoc V. Le, Ed H. Chi, Denny Zhou
•
Jun 6, 2024
•
14
0
¿Por qué ha resultado difícil predecir las capacidades posteriores de los modelos de IA de vanguardia con el escalamiento?
Why Has Predicting Downstream Capabilities of Frontier AI Models with Scale Remained Elusive?
Rylan Schaeffer, Hailey Schoelkopf, Brando Miranda, Gabriel Mukobi, Varun Madan, Adam Ibrahim, Herbie Bradley, Stella Biderman, Sanmi Koyejo
•
Jun 6, 2024
•
9
0
Mejorando la Eficiencia del Entrenamiento Paralelo a Gran Escala con C4: Un Enfoque Basado en la Comunicación
Boosting Large-scale Parallel Training Efficiency with C4: A Communication-Driven Approach
Jianbo Dong, Bin Luo, Jun Zhang, Pengcheng Zhang, Fei Feng, Yikai Zhu, Ang Liu, Zian Chen, Yi Shi, Hairong Jiao, Gang Lu, Yu Guan, Ennan Zhai, Wencong Xiao, Hanyu Zhao, Man Yuan, Siran Yang, Xiang Li, Jiamang Wang, Rui Men, Jianwei Zhang, Huang Zhong, Dennis Cai, Yuan Xie, Binzhang Fu
•
Jun 7, 2024
•
8
0