ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
June 25th, 2024
Cambrian-1: Una exploración completamente abierta y centrada en la visión de modelos de lenguaje multimodal (LLMs)
Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs
Shengbang Tong, Ellis Brown, Penghao Wu, Sanghyun Woo, Manoj Middepogu, Sai Charitha Akula, Jihan Yang, Shusheng Yang, Adithya Iyer, Xichen Pan, Austin Wang, Rob Fergus, Yann LeCun, Saining Xie
•
Jun 24, 2024
•
61
4
DreamBench++: Un Benchmark Alineado con Humanos para la Generación Personalizada de Imágenes
DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation
Yuang Peng, Yuxin Cui, Haomiao Tang, Zekun Qi, Runpei Dong, Jing Bai, Chunrui Han, Zheng Ge, Xiangyu Zhang, Shu-Tao Xia
•
Jun 24, 2024
•
57
4
BigCodeBench: Evaluación de la Generación de Código con Llamadas a Funciones Diversas e Instrucciones Complejas
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions
Terry Yue Zhuo, Minh Chien Vu, Jenny Chim, Han Hu, Wenhao Yu, Ratnadira Widyasari, Imam Nur Bani Yusuf, Haolan Zhan, Junda He, Indraneil Paul, Simon Brunner, Chen Gong, Thong Hoang, Armel Randy Zebaze, Xiaoheng Hong, Wen-Ding Li, Jean Kaddour, Ming Xu, Zhihan Zhang, Prateek Yadav, Naman Jain, Alex Gu, Zhoujun Cheng, Jiawei Liu, Qian Liu, Zijian Wang, David Lo, Binyuan Hui, Niklas Muennighoff, Daniel Fried, Xiaoning Du, Harm de Vries, Leandro Von Werra
•
Jun 22, 2024
•
47
8
Evaluación del D-MERIT de la anotación parcial en la recuperación de información
Evaluating D-MERIT of Partial-annotation on Information Retrieval
Royi Rassin, Yaron Fairstein, Oren Kalinsky, Guy Kushilevitz, Nachshon Cohen, Alexander Libov, Yoav Goldberg
•
Jun 23, 2024
•
36
2
Transferencia de Contexto Extendido del Lenguaje a la Visión
Long Context Transfer from Language to Vision
Peiyuan Zhang, Kaichen Zhang, Bo Li, Guangtao Zeng, Jingkang Yang, Yuanhan Zhang, Ziyue Wang, Haoran Tan, Chunyuan Li, Ziwei Liu
•
Jun 24, 2024
•
34
2
Video-Infinity: Generación Distribuida de Videos Largos
Video-Infinity: Distributed Long Video Generation
Zhenxiong Tan, Xingyi Yang, Songhua Liu, Xinchao Wang
•
Jun 24, 2024
•
30
2
VideoHallucer: Evaluación de Alucinaciones Intrínsecas y Extrínsecas en Modelos de Lenguaje y Video a Gran Escala
VideoHallucer: Evaluating Intrinsic and Extrinsic Hallucinations in Large Video-Language Models
Yuxuan Wang, Yueqian Wang, Dongyan Zhao, Cihang Xie, Zilong Zheng
•
Jun 24, 2024
•
27
2
WARP: Sobre los beneficios de las políticas recompensadas con promedio de pesos
WARP: On the Benefits of Weight Averaged Rewarded Policies
Alexandre Ramé, Johan Ferret, Nino Vieillard, Robert Dadashi, Léonard Hussenot, Pierre-Louis Cedoz, Pier Giuseppe Sessa, Sertan Girgin, Arthur Douillard, Olivier Bachem
•
Jun 24, 2024
•
23
1
Leyes de Escalabilidad para Modelos de Lenguaje de Complejidad Lineal
Scaling Laws for Linear Complexity Language Models
Xuyang Shen, Dong Li, Ruitao Leng, Zhen Qin, Weigao Sun, Yiran Zhong
•
Jun 24, 2024
•
23
4
Hacia una Inferencia Rápida en Modelos de Lenguaje Multilingües: Decodificación Especulativa y Modelos Especializados de Borrador
Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters
Euiin Yi, Taehyeon Kim, Hongseok Jeung, Du-Seong Chang, Se-Young Yun
•
Jun 24, 2024
•
20
3
Entrenamiento Continuo Eficiente mediante la Mitigación de la Brecha de Estabilidad
Efficient Continual Pre-training by Mitigating the Stability Gap
Yiduo Guo, Jie Fu, Huishuai Zhang, Dongyan Zhao, Yikang Shen
•
Jun 21, 2024
•
20
1
Sparser es más rápido y menos es más: Atención dispersa eficiente para Transformers de largo alcance
Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers
Chao Lou, Zixia Jia, Zilong Zheng, Kewei Tu
•
Jun 24, 2024
•
19
1
Sondas de Entropía Semántica: Detección Robusta y Económica de Alucinaciones en Modelos de Lenguaje de Gran Escala
Semantic Entropy Probes: Robust and Cheap Hallucination Detection in LLMs
Jannik Kossen, Jiatong Han, Muhammed Razzak, Lisa Schut, Shreshth Malik, Yarin Gal
•
Jun 22, 2024
•
14
1
Más allá del juego por turnos: Habilitando conversaciones en tiempo real con modelos dúplex
Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models
Xinrong Zhang, Yingfa Chen, Shengding Hu, Xu Han, Zihang Xu, Yuanwei Xu, Weilin Zhao, Maosong Sun, Zhiyuan Liu
•
Jun 22, 2024
•
14
2
Afinamiento de Preferencias para la Mitigación de Toxicidad Generaliza a Través de Idiomas
Preference Tuning For Toxicity Mitigation Generalizes Across Languages
Xiaochen Li, Zheng-Xin Yong, Stephen H. Bach
•
Jun 23, 2024
•
11
1
AutoDetect: Hacia un Marco Unificado para la Detección Automática de Debilidades en Modelos de Lenguaje a Gran Escala
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models
Jiale Cheng, Yida Lu, Xiaotao Gu, Pei Ke, Xiao Liu, Yuxiao Dong, Hongning Wang, Jie Tang, Minlie Huang
•
Jun 24, 2024
•
10
2
Neuronas de Regulación de Confianza en Modelos de Lenguaje
Confidence Regulation Neurons in Language Models
Alessandro Stolfo, Ben Wu, Wes Gurnee, Yonatan Belinkov, Xingyi Song, Mrinmaya Sachan, Neel Nanda
•
Jun 24, 2024
•
10
1
¿Cuántos parámetros se necesitan para cambiar una bombilla? Evaluación del rendimiento en juegos conversacionales de autojuego en función de las características del modelo
How Many Parameters Does it Take to Change a Light Bulb? Evaluating Performance in Self-Play of Conversational Games as a Function of Model Characteristics
Nidhir Bhavsar, Jonathan Jordan, Sherzod Hakimov, David Schlangen
•
Jun 20, 2024
•
9
1
ClotheDreamer: Generación de prendas guiada por texto con Gaussianas 3D
ClotheDreamer: Text-Guided Garment Generation with 3D Gaussians
Yufei Liu, Junshu Tang, Chu Zheng, Shijie Zhang, Jinkun Hao, Junwei Zhu, Dongjin Huang
•
Jun 24, 2024
•
7
1
Encontrado en el medio: Calibrar el sesgo de atención posicional mejora la utilización de contextos largos
Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization
Cheng-Yu Hsieh, Yung-Sung Chuang, Chun-Liang Li, Zifeng Wang, Long T. Le, Abhishek Kumar, James Glass, Alexander Ratner, Chen-Yu Lee, Ranjay Krishna, Tomas Pfister
•
Jun 23, 2024
•
6
1
IRASim: Aprendizaje de simuladores de acciones interactivas para robots reales
IRASim: Learning Interactive Real-Robot Action Simulators
Fangqi Zhu, Hongtao Wu, Song Guo, Yuxiao Liu, Chilam Cheang, Tao Kong
•
Jun 20, 2024
•
6
1
video-SALMONN: Modelos de Lenguaje de Gran Escala Audio-Visuales Mejorados con Voz
video-SALMONN: Speech-Enhanced Audio-Visual Large Language Models
Guangzhi Sun, Wenyi Yu, Changli Tang, Xianzhao Chen, Tian Tan, Wei Li, Lu Lu, Zejun Ma, Yuxuan Wang, Chao Zhang
•
Jun 22, 2024
•
5
1
¿Puede funcionar el aprendizaje con pocos ejemplos en contextos largos? Reciclando el contexto para generar demostraciones
Can Few-shot Work in Long-Context? Recycling the Context to Generate Demonstrations
Arie Cattan, Alon Jacovi, Alex Fabrikant, Jonathan Herzig, Roee Aharoni, Hannah Rashkin, Dror Marcus, Avinatan Hassidim, Yossi Matias, Idan Szpektor, Avi Caciularu
•
Jun 19, 2024
•
5
1
Distilación de Puntuación Repulsiva para el Muestreo Diverso en Modelos de Difusión
Repulsive Score Distillation for Diverse Sampling of Diffusion Models
Nicolas Zilberstein, Morteza Mardani, Santiago Segarra
•
Jun 24, 2024
•
4
2
Clasificación de Medallas de OlympicArena: ¿Quién es la IA más inteligente hasta ahora?
OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far?
Zhen Huang, Zengzhi Wang, Shijie Xia, Pengfei Liu
•
Jun 24, 2024
•
2
2