ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
August 7th, 2024
Escalar de manera óptima el cálculo del tiempo de prueba de LLM puede ser más efectivo que escalar los parámetros del modelo.
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters
Charlie Snell, Jaehoon Lee, Kelvin Xu, Aviral Kumar
•
Aug 6, 2024
•
63
3
MMIU: Comprensión Multimodal Multi-imagen para Evaluar Modelos de Visión-Lenguaje Grandes
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models
Fanqing Meng, Jin Wang, Chuanhao Li, Quanfeng Lu, Hao Tian, Jiaqi Liao, Xizhou Zhu, Jifeng Dai, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao
•
Aug 5, 2024
•
62
3
LLaVA-OneVision: Transferencia Sencilla de Tareas Visuales
LLaVA-OneVision: Easy Visual Task Transfer
Bo Li, Yuanhan Zhang, Dong Guo, Renrui Zhang, Feng Li, Hao Zhang, Kaichen Zhang, Yanwei Li, Ziwei Liu, Chunyuan Li
•
Aug 6, 2024
•
61
2
Un objeto vale 64x64 píxeles: Generando objetos 3D a través de la difusión de imágenes
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion
Xingguang Yan, Han-Hung Lee, Ziyu Wan, Angel X. Chang
•
Aug 6, 2024
•
41
3
MedTrinity-25M: Un conjunto de datos multimodal a gran escala con anotaciones multigranulares para medicina
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine
Yunfei Xie, Ce Zhou, Lang Gao, Juncheng Wu, Xianhang Li, Hong-Yu Zhou, Sheng Liu, Lei Xing, James Zou, Cihang Xie, Yuyin Zhou
•
Aug 6, 2024
•
30
2
IPAdapter-Instruct: Resolviendo Ambigüedad en la Condicionamiento basado en Imágenes usando Instruct Prompts
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
Ciara Rowles, Shimon Vainer, Dante De Nigris, Slava Elizarov, Konstantin Kutsy, Simon Donné
•
Aug 6, 2024
•
23
2
CoverBench: Un desafiante banco de pruebas para la verificación de reclamos complejos
CoverBench: A Challenging Benchmark for Complex Claim Verification
Alon Jacovi, Moran Ambar, Eyal Ben-David, Uri Shaham, Amir Feder, Mor Geva, Dror Marcus, Avi Caciularu
•
Aug 6, 2024
•
15
2
Modelos de Difusión como Herramientas de Minería de Datos
Diffusion Models as Data Mining Tools
Ioannis Siglidis, Aleksander Holynski, Alexei A. Efros, Mathieu Aubry, Shiry Ginosar
•
Jul 20, 2024
•
14
2
ReSyncer: Reconfiguración del Generador basado en Estilo para un Intérprete Facial Audiovisualmente Sincronizado Unificado
ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer
Jiazhi Guan, Zhiliang Xu, Hang Zhou, Kaisiyuan Wang, Shengyi He, Zhanwang Zhang, Borong Liang, Haocheng Feng, Errui Ding, Jingtuo Liu, Jingdong Wang, Youjian Zhao, Ziwei Liu
•
Aug 6, 2024
•
11
2
Sintetizando datos de Texto-a-SQL de LLMs Débiles y Fuertes
Synthesizing Text-to-SQL Data from Weak and Strong LLMs
Jiaxi Yang, Binyuan Hui, Min Yang, Jian Yang, Junyang Lin, Chang Zhou
•
Aug 6, 2024
•
11
2
StructEval: Profundizar y Ampliar la Evaluación de Modelos de Lenguaje Grandes a través de Evaluación Estructurada
StructEval: Deepen and Broaden Large Language Model Assessment via Structured Evaluation
Boxi Cao, Mengjie Ren, Hongyu Lin, Xianpei Han, Feng Zhang, Junfeng Zhan, Le Sun
•
Aug 6, 2024
•
10
2
AVESFormer: Diseño eficiente de Transformer para la segmentación audiovisual en tiempo real
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation
Zili Wang, Qi Yang, Linsu Shi, Jiazhong Yu, Qinghua Liang, Fei Li, Shiming Xiang
•
Aug 3, 2024
•
4
2