ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
August 12th, 2024
VITA: Hacia un LLM multimodal omni interactivo de código abierto.
VITA: Towards Open-Source Interactive Omni Multimodal LLM
Chaoyou Fu, Haojia Lin, Zuwei Long, Yunhang Shen, Meng Zhao, Yifan Zhang, Xiong Wang, Di Yin, Long Ma, Xiawu Zheng, Ran He, Rongrong Ji, Yunsheng Wu, Caifeng Shan, Xing Sun
•
Aug 9, 2024
•
49
3
Gemma Scope: Autoencoders dispersos abiertos en todas partes al mismo tiempo en Gemma 2
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2
Tom Lieberum, Senthooran Rajamanoharan, Arthur Conmy, Lewis Smith, Nicolas Sonnerat, Vikrant Varma, János Kramár, Anca Dragan, Rohin Shah, Neel Nanda
•
Aug 9, 2024
•
40
2
mPLUG-Owl3: Hacia la comprensión de secuencias largas de imágenes en modelos de lenguaje multimodales a gran escala
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models
Jiabo Ye, Haiyang Xu, Haowei Liu, Anwen Hu, Ming Yan, Qi Qian, Ji Zhang, Fei Huang, Jingren Zhou
•
Aug 9, 2024
•
35
2
UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling
Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim
•
Aug 9, 2024
•
25
2
ToolSandbox: Un punto de referencia de evaluación interactivo, conversacional y con estado para las capacidades de uso de herramientas de LLM.
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities
Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang
•
Aug 8, 2024
•
18
4
Propagación de Características Inspirada en Kalman para la Super-Resolución Facial en Videos
Kalman-Inspired Feature Propagation for Video Face Super-Resolution
Ruicheng Feng, Chongyi Li, Chen Change Loy
•
Aug 9, 2024
•
10
3
BRAT: Token adicional ortogonal para inversión textual agnóstica de arquitectura.
BRAT: Bonus oRthogonAl Token for Architecture Agnostic Textual Inversion
James Baker
•
Aug 8, 2024
•
9
2
MooER: Modelos de Reconocimiento y Traducción de Voz basados en LLM de Moore Threads
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads
Junhao Xu, Zhenlin Liang, Yi Liu, Yichao Hu, Jian Li, Yajun Zheng, Meng Cai, Hua Wang
•
Aug 9, 2024
•
8
2
MulliVC: Conversión de Voz Multilingüe con Consistencia de Ciclo
MulliVC: Multi-lingual Voice Conversion With Cycle Consistency
Jiawei Huang, Chen Zhang, Yi Ren, Ziyue Jiang, Zhenhui Ye, Jinglin Liu, Jinzheng He, Xiang Yin, Zhou Zhao
•
Aug 8, 2024
•
8
2
Generación de nuevas hipótesis experimentales a partir de modelos de lenguaje: Un estudio de caso sobre generalización cruzada de dativos.
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization
Kanishka Misra, Najoung Kim
•
Aug 9, 2024
•
6
1