ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
February 14th, 2024
BASE TTS: Lecciones de la construcción de un modelo de Texto a Voz con mil millones de parámetros entrenado con 100 mil horas de datos
BASE TTS: Lessons from building a billion-parameter Text-to-Speech model on 100K hours of data
Mateusz Łajszczak, Guillermo Cámbara, Yang Li, Fatih Beyhan, Arent van Korlaar, Fan Yang, Arnaud Joly, Álvaro Martín-Cortinas, Ammar Abbas, Adam Michalski, Alexis Moinet, Sri Karlapati, Ewa Muszyńska, Haohan Guo, Bartosz Putrycz, Soledad López Gambino, Kayeon Yoo, Elena Sokolova, Thomas Drugman
•
Feb 12, 2024
•
62
9
Modelo Mundial en Video y Lenguaje de Millones de Longitudes con RingAttention
World Model on Million-Length Video And Language With RingAttention
Hao Liu, Wilson Yan, Matei Zaharia, Pieter Abbeel
•
Feb 13, 2024
•
40
5
Las Mezclas de Expertos Desbloquean el Escalado de Parámetros para el Aprendizaje por Refuerzo Profundo
Mixtures of Experts Unlock Parameter Scaling for Deep RL
Johan Obando-Ceron, Ghada Sokar, Timon Willi, Clare Lyle, Jesse Farebrother, Jakob Foerster, Gintare Karolina Dziugaite, Doina Precup, Pablo Samuel Castro
•
Feb 13, 2024
•
37
2
Lumos: Potenciando los LLM multimodales con reconocimiento de texto en escenas
Lumos : Empowering Multimodal LLMs with Scene Text Recognition
Ashish Shenoy, Yichao Lu, Srihari Jayakumar, Debojeet Chatterjee, Mohsen Moslehpour, Pierce Chuang, Abhay Harpale, Vikas Bhardwaj, Di Xu, Shicong Zhao, Longfang Zhao, Ankit Ramchandani, Xin Luna Dong, Anuj Kumar
•
Feb 12, 2024
•
28
2
Graph Mamba: Hacia el Aprendizaje en Grafos con Modelos de Espacio de Estados
Graph Mamba: Towards Learning on Graphs with State Space Models
Ali Behrouz, Farnoosh Hashemi
•
Feb 13, 2024
•
17
1
UFO: Un Agente Centrado en la Interfaz de Usuario para la Interacción con el Sistema Operativo Windows
UFO: A UI-Focused Agent for Windows OS Interaction
Chaoyun Zhang, Liqun Li, Shilin He, Xu Zhang, Bo Qiao, Si Qin, Minghua Ma, Yu Kang, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Qi Zhang
•
Feb 8, 2024
•
16
3
IM-3D: Difusión y Reconstrucción Iterativa Multivista para la Generación de 3D de Alta Calidad
IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation
Luke Melas-Kyriazi, Iro Laina, Christian Rupprecht, Natalia Neverova, Andrea Vedaldi, Oran Gafni, Filippos Kokkinos
•
Feb 13, 2024
•
14
1
ChatCell: Facilitación del Análisis de Células Individuales mediante Lenguaje Natural
ChatCell: Facilitating Single-Cell Analysis with Natural Language
Yin Fang, Kangwei Liu, Ningyu Zhang, Xinle Deng, Penghui Yang, Zhuo Chen, Xiangru Tang, Mark Gerstein, Xiaohui Fan, Huajun Chen
•
Feb 13, 2024
•
14
4
Aprendizaje de Palabras 3D Continuas para la Generación de Texto a Imagen
Learning Continuous 3D Words for Text-to-Image Generation
Ta-Ying Cheng, Matheus Gadelha, Thibault Groueix, Matthew Fisher, Radomir Mech, Andrew Markham, Niki Trigoni
•
Feb 13, 2024
•
12
4
Transformadores en Tándem para LLMs Eficientes en Inferencia
Tandem Transformers for Inference Efficient LLMs
Aishwarya P S, Pranav Ajit Nair, Yashas Samaga, Toby Boyd, Sanjiv Kumar, Prateek Jain, Praneeth Netrapalli
•
Feb 13, 2024
•
10
1
Personalización de Gestos Manuales Basada en Visión a partir de una Única Demostración
Vision-Based Hand Gesture Customization from a Single Demonstration
Soroush Shahi, Cori Tymoszek Park, Richard Kang, Asaf Liberman, Oron Levy, Jun Gong, Abdelkareem Bedri, Gierad Laput
•
Feb 13, 2024
•
9
2
Analogías NeRF: Transferencia de Atributos Visuales Basada en Ejemplos para NeRFs
NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs
Michael Fischer, Zhengqin Li, Thu Nguyen-Phuoc, Aljaz Bozic, Zhao Dong, Carl Marshall, Tobias Ritschel
•
Feb 13, 2024
•
6
1