ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
June 21st, 2024
nabla^2DFT: Un Conjunto de Datos Universal de Química Cuántica para Moléculas Similares a Fármacos y un Punto de Referencia para Potenciales de Redes Neuronales
nabla^2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials
Kuzma Khrabrov, Anton Ber, Artem Tsypin, Konstantin Ushenin, Egor Rumiantsev, Alexander Telepov, Dmitry Protasov, Ilya Shenbin, Anton Alekseev, Mikhail Shirokikh, Sergey Nikolenko, Elena Tutubalina, Artur Kadurin
•
Jun 20, 2024
•
102
4
Preentrenamiento de Instrucciones: Los Modelos de Lenguaje son Aprendices Multitarea Supervisados
Instruction Pre-Training: Language Models are Supervised Multitask Learners
Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei
•
Jun 20, 2024
•
94
25
El diablo está en los detalles: StyleFeatureEditor para la inversión de StyleGAN rica en detalles y la edición de imágenes de alta calidad
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing
Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov
•
Jun 15, 2024
•
70
2
HARE: Priores Humanos, clave para la eficiencia de los modelos de lenguaje pequeños
HARE: HumAn pRiors, a key to small language model Efficiency
Lingyun Zhang, Bin jin, Gaojian Ge, Lunhui Liu, Xuewen Shen, Mingyong Wu, Houqian Zhang, Yongneng Jiang, Shiqi Chen, Shi Pu
•
Jun 17, 2024
•
40
1
Prism: Un marco para desacoplar y evaluar las capacidades de los modelos de lenguaje visual
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
36
2
MMBench-Video: Un punto de referencia de múltiples tomas y formato extenso para la comprensión holística de videos
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding
Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
34
1
Fusión de Modelos y Alineación de Seguridad: Un Modelo Defectuoso Arruina el Conjunto
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch
Hasan Abed Al Kader Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr, Adel Bibi, Bernard Ghanem, Mete Ozay
•
Jun 20, 2024
•
31
1
Pizarra-de-Pensamiento: Pensamiento Paso a Paso a través de Modalidades
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
Sachit Menon, Richard Zemel, Carl Vondrick
•
Jun 20, 2024
•
29
1
Distribución de Consistencia Invertible para la Edición de Imágenes Guiada por Texto en Aproximadamente 7 Pasos
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps
Nikita Starodubcev, Mikhail Khoroshikh, Artem Babenko, Dmitry Baranchuk
•
Jun 20, 2024
•
28
1
GLiNER multitarea: Modelo ligero generalista para diversas tareas de extracción de información
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks
Ihor Stepanov, Mykhailo Shtopko
•
Jun 14, 2024
•
26
3
PIN: Un Conjunto de Datos de Alta Complejidad para Documentos Multimodales Emparejados e Intercalados
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
Junjie Wang, Yin Zhang, Yatai Ji, Yuxiang Zhang, Chunyang Jiang, Yubo Wang, Kang Zhu, Zekun Wang, Tiezhen Wang, Wenhao Huang, Jie Fu, Bei Chen, Qunshu Lin, Minghao Liu, Ge Zhang, Wenhu Chen
•
Jun 20, 2024
•
23
1
DigiRL: Entrenamiento de agentes de control de dispositivos en entornos reales con aprendizaje por refuerzo autónomo
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning
Hao Bai, Yifei Zhou, Mert Cemri, Jiayi Pan, Alane Suhr, Sergey Levine, Aviral Kumar
•
Jun 14, 2024
•
20
1
Autoaprendizaje con Retroalimentación de Ejecución: Mejorando las Capacidades de Seguimiento de Instrucciones en Modelos de Lenguaje a Gran Escala
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
Guanting Dong, Keming Lu, Chengpeng Li, Tingyu Xia, Bowen Yu, Chang Zhou, Jingren Zhou
•
Jun 19, 2024
•
16
2
LiveMind: Modelos de Lenguaje de Gran Escala con Baja Latencia e Inferencia Simultánea
LiveMind: Low-latency Large Language Models with Simultaneous Inference
Chuangtao Chen, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li
•
Jun 20, 2024
•
14
4
Mejorando el sentido común visual en modelos de lenguaje mediante la generación múltiple de imágenes
Improving Visual Commonsense in Language Models via Multiple Image Generation
Guy Yariv, Idan Schwartz, Yossi Adi, Sagie Benaim
•
Jun 19, 2024
•
13
2
Optimización Directa de Preferencias con Regularización de Longitud Iterativa: Un Estudio de Caso sobre la Mejora de Modelos de Lenguaje de 7B al Nivel de GPT-4
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
Jie Liu, Zhanhui Zhou, Jiaheng Liu, Xingyuan Bu, Chao Yang, Han-Sen Zhong, Wanli Ouyang
•
Jun 17, 2024
•
13
1
REPOEXEC: Evaluación de Generación de Código con un Benchmark Ejecutable a Nivel de Repositorio
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark
Nam Le Hai, Dung Manh Nguyen, Nghi D. Q. Bui
•
Jun 17, 2024
•
11
1
ExVideo: Extensión de Modelos de Difusión de Video mediante Ajuste Posterior de Parámetros Eficiente
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning
Zhongjie Duan, Wenmeng Zhou, Cen Chen, Yaliang Li, Weining Qian
•
Jun 20, 2024
•
10
3
τ-bench: Un punto de referencia para la interacción entre herramientas, agentes y usuarios en dominios del mundo real
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains
Shunyu Yao, Noah Shinn, Pedram Razavi, Karthik Narasimhan
•
Jun 17, 2024
•
8
3
Atribución de Respuestas Basada en los Componentes Internos del Modelo para la Generación Aumentada por Recuperación Confiable
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
Jirui Qi, Gabriele Sarti, Raquel Fernández, Arianna Bisazza
•
Jun 19, 2024
•
7
1
StableSemantics: Un Conjunto de Datos Sintético de Lenguaje-Visión para Representaciones Semánticas en Imágenes Naturalistas
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images
Rushikesh Zawar, Shaurya Dewan, Andrew F. Luo, Margaret M. Henderson, Michael J. Tarr, Leila Wehbe
•
Jun 19, 2024
•
5
1
De la comprensión a la acción: El impacto de la interpretabilidad y el análisis en la investigación sobre PLN
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP
Marius Mosbach, Vagrant Gautam, Tomás Vergara-Browne, Dietrich Klakow, Mor Geva
•
Jun 18, 2024
•
5
1
Una Revisión Sistemática de la Resumen Automático de Textos: Desde Métodos Estadísticos Hasta Modelos de Lenguaje a Gran Escala
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models
Haopeng Zhang, Philip S. Yu, Jiawei Zhang
•
Jun 17, 2024
•
5
2
Muestreo de Escenas 3D Gaussianas en Segundos con Modelos de Difusión Latente
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models
Paul Henderson, Melonie de Almeida, Daniela Ivanova, Titas Anciukevičius
•
Jun 18, 2024
•
4
1