ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
October 21st, 2024
SeerAttention: Aprendizaje de Atención Esparsa Intrínseca en sus LLMs
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs
Yizhao Gao, Zhichen Zeng, Dayou Du, Shijie Cao, Hayden Kwok-Hay So, Ting Cao, Fan Yang, Mao Yang
•
Oct 17, 2024
•
30
2
Currículo de Difusión: Aprendizaje de Currículo Generativo Sintético-a-Real a través de Difusión Guiada por Imagen.
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion
Yijun Liang, Shweta Bhardwaj, Tianyi Zhou
•
Oct 17, 2024
•
17
3
FiTv2: Transformer de Visión Flexible Escalable y Mejorado para Modelos de Difusión
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model
ZiDong Wang, Zeyu Lu, Di Huang, Cai Zhou, Wanli Ouyang, and Lei Bai
•
Oct 17, 2024
•
24
3
HART: Generación Visual Eficiente con Transformador Autoregresivo Híbrido
HART: Efficient Visual Generation with Hybrid Autoregressive Transformer
Haotian Tang, Yecheng Wu, Shang Yang, Enze Xie, Junsong Chen, Junyu Chen, Zhuoyang Zhang, Han Cai, Yao Lu, Song Han
•
Oct 14, 2024
•
18
2
Montessori-Instruct: Generación de Datos de Entrenamiento Influyentes Adaptados para el Aprendizaje del Estudiante
Montessori-Instruct: Generate Influential Training Data Tailored for Student Learning
Xiaochuan Li, Zichun Yu, Chenyan Xiong
•
Oct 18, 2024
•
3
2
MagicTailor: Personalización Controlable por Componentes en Modelos de Difusión Texto-a-Imagen
MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models
Donghao Zhou, Jiancheng Huang, Jinbin Bai, Jiaze Wang, Hao Chen, Guangyong Chen, Xiaowei Hu, Pheng-Ann Heng
•
Oct 17, 2024
•
38
7
UCFE: Un punto de referencia de experiencia financiera centrado en el usuario para modelos de lenguaje grandes
UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models
Yuzhe Yang, Yifei Zhang, Yan Hu, Yilin Guo, Ruoli Gan, Yueru He, Mingcong Lei, Xiao Zhang, Haining Wang, Qianqian Xie, Jimin Huang, Honghai Yu, Benyou Wang
•
Oct 17, 2024
•
61
2
Mini-Omni2: Hacia un GPT-4o de código abierto con capacidades de visión, habla y dúplex.
Mini-Omni2: Towards Open-source GPT-4o with Vision, Speech and Duplex Capabilities
Zhifei Xie, Changqiao Wu
•
Oct 15, 2024
•
22
2
BiGR: Aprovechando Códigos Latentes Binarios para Generación de Imágenes y Mejora de las Capacidades de Representación Visual
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities
Shaozhe Hao, Xuantong Liu, Xianbiao Qi, Shihao Zhao, Bojia Zi, Rong Xiao, Kai Han, Kwan-Yee K. Wong
•
Oct 18, 2024
•
8
2
¿Son Suficientemente Buenos los Detectores de IA? Una Encuesta sobre la Calidad de los Conjuntos de Datos con Textos Generados por Máquinas
Are AI Detectors Good Enough? A Survey on Quality of Datasets With Machine-Generated Texts
German Gritsai, Anastasia Voznyuk, Andrey Grabovoy, Yury Chekhovich
•
Oct 18, 2024
•
12
5
Agentes Web con Modelos del Mundo: Aprendiendo y Aprovechando la Dinámica del Entorno en la Navegación Web
Web Agents with World Models: Learning and Leveraging Environment Dynamics in Web Navigation
Hyungjoo Chae, Namyoung Kim, Kai Tzu-iunn Ong, Minju Gwak, Gwanwoo Song, Jihoon Kim, Sunghwan Kim, Dongha Lee, Jinyoung Yeo
•
Oct 17, 2024
•
44
2
NaturalBench: Evaluando Modelos Visión-Lenguaje en Muestras Adversarias Naturales
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples
Baiqi Li, Zhiqiu Lin, Wenxuan Peng, Jean de Dieu Nyandwi, Daniel Jiang, Zixian Ma, Simran Khanuja, Ranjay Krishna, Graham Neubig, Deva Ramanan
•
Oct 18, 2024
•
40
4
SHAKTI: Un modelo de lenguaje pequeño con 2.5 mil millones de parámetros optimizado para la inteligencia artificial en el borde y entornos de recursos limitados.
SHAKTI: A 2.5 Billion Parameter Small Language Model Optimized for Edge AI and Low-Resource Environments
Syed Abdul Gaffar Shakhadri, Kruthika KR, Rakshit Aralimatti
•
Oct 15, 2024
•
8
3
El contexto es clave (NMF): Modelado de la dinámica de información temática en los medios de la diáspora china.
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media
Ross Deans Kristensen-McLachlan, Rebecca M. M. Hicke, Márton Kardos, Mette Thunø
•
Oct 16, 2024
•
5
3
DPLM-2: Un Modelo de Lenguaje de Proteínas de Difusión Multimodal
DPLM-2: A Multimodal Diffusion Protein Language Model
Xinyou Wang, Zaixiang Zheng, Fei Ye, Dongyu Xue, Shujian Huang, Quanquan Gu
•
Oct 17, 2024
•
22
3
Mirando hacia adentro: Los modelos de lenguaje pueden aprender sobre sí mismos a través de la introspección.
Looking Inward: Language Models Can Learn About Themselves by Introspection
Felix J Binder, James Chua, Tomek Korbak, Henry Sleight, John Hughes, Robert Long, Ethan Perez, Miles Turpin, Owain Evans
•
Oct 17, 2024
•
8
11
DAWN: Avatar de Marco Dinámico con Marco de Difusión No Autoregresivo para la Generación de Vídeos de Cabeza Parlante
DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation
Hanbo Cheng, Limin Lin, Chenyu Liu, Pengcheng Xia, Pengfei Hu, Jiefeng Ma, Jun Du, Jia Pan
•
Oct 17, 2024
•
12
2
¿Cómo influyen los métodos de entrenamiento en la utilización de modelos de visión?
How Do Training Methods Influence the Utilization of Vision Models?
Paul Gavrikov, Shashank Agnihotri, Margret Keuper, Janis Keuper
•
Oct 18, 2024
•
5
2
Enseñando a los Modelos a Equilibrar la Resistencia y la Aceptación de la Persuasión.
Teaching Models to Balance Resisting and Accepting Persuasion
Elias Stengel-Eskin, Peter Hase, Mohit Bansal
•
Oct 18, 2024
•
3
2
Un error común en la alineación de modelos de lenguaje basados en márgenes: Entrelazamiento de gradientes.
A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement
Hui Yuan, Yifan Zeng, Yue Wu, Huazheng Wang, Mengdi Wang, Liu Leqi
•
Oct 17, 2024
•
4
2