ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
July 4th, 2024
InternLM-XComposer-2.5: Un modelo de lenguaje de visión grande versátil que admite entradas y salidas contextuales largas.
InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input and Output
Pan Zhang, Xiaoyi Dong, Yuhang Zang, Yuhang Cao, Rui Qian, Lin Chen, Qipeng Guo, Haodong Duan, Bin Wang, Linke Ouyang, Songyang Zhang, Wenwei Zhang, Yining Li, Yang Gao, Peng Sun, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Hang Yan, Conghui He, Xingcheng Zhang, Kai Chen, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang
•
Jul 3, 2024
•
96
5
TabReD: Un conjunto de pruebas de aprendizaje automático tabular en entornos reales
TabReD: A Benchmark of Tabular Machine Learning in-the-Wild
Ivan Rubachev, Nikolay Kartashev, Yury Gorishniy, Artem Babenko
•
Jun 27, 2024
•
51
6
Sin entrenamiento, sin problema: Repensando la orientación sin clasificador para Modelos de Difusión
No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models
Seyedmorteza Sadat, Manuel Kansy, Otmar Hilliges, Romann M. Weber
•
Jul 2, 2024
•
26
1
TokenPacker: Proyector Visual Eficiente para LLM Multimodal
TokenPacker: Efficient Visual Projector for Multimodal LLM
Wentong Li, Yuqian Yuan, Jian Liu, Dongqi Tang, Song Wang, Jianke Zhu, Lei Zhang
•
Jul 2, 2024
•
24
4
PicoAudio: Permitiendo el Control Preciso de la Marca de Tiempo y Frecuencia de Eventos de Audio en la Generación de Texto a Audio
PicoAudio: Enabling Precise Timestamp and Frequency Controllability of Audio Events in Text-to-audio Generation
Zeyu Xie, Xuenan Xu, Zhizheng Wu, Mengyue Wu
•
Jul 3, 2024
•
21
5
DisCo-Diff: Mejorando Modelos de Difusión Continua con Latentes Discretos
DisCo-Diff: Enhancing Continuous Diffusion Models with Discrete Latents
Yilun Xu, Gabriele Corso, Tommi Jaakkola, Arash Vahdat, Karsten Kreis
•
Jul 3, 2024
•
14
1
Investigación sobre Modelos de Lenguaje Grandes basados únicamente en Decodificadores para la Traducción de Voz a Texto.
Investigating Decoder-only Large Language Models for Speech-to-text Translation
Chao-Wei Huang, Hui Lu, Hongyu Gong, Hirofumi Inaguma, Ilia Kulikov, Ruslan Mavlyutov, Sravya Popuri
•
Jul 3, 2024
•
11
1
Una Falsa Sensación de Seguridad: Fugas de Información Inseguras en la IA 'Segura' - Respuestas
A False Sense of Safety: Unsafe Information Leakage in 'Safe' AI Responses
David Glukhov, Ziwen Han, Ilia Shumailov, Vardan Papyan, Nicolas Papernot
•
Jul 2, 2024
•
9
1
Eliminación del Sesgo de Posición de los Modelos de Lenguaje: Un Enfoque Mecanicista
Eliminating Position Bias of Language Models: A Mechanistic Approach
Ziqi Wang, Hanlin Zhang, Xiner Li, Kuan-Hao Huang, Chi Han, Shuiwang Ji, Sham M. Kakade, Hao Peng, Heng Ji
•
Jul 1, 2024
•
8
1