ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
October 22nd, 2024
PUMA: Potenciando MLLM Unificado con Generación Visual Multi-granular
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation
Rongyao Fang, Chengqi Duan, Kun Wang, Hao Li, Hao Tian, Xingyu Zeng, Rui Zhao, Jifeng Dai, Hongsheng Li, Xihui Liu
•
Oct 17, 2024
•
57
3
AutoTrain: Entrenamiento sin código para modelos de última generación
AutoTrain: No-code training for state-of-the-art models
Abhishek Thakur
•
Oct 21, 2024
•
60
2
Ichigo: Asistente de Voz en Tiempo Real de Fusión Temprana de Modalidades Mixtas
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant
Alan Dao, Dinh Bach Vu, Huy Hoang Ha
•
Oct 20, 2024
•
11
5
SemiEvol: Ajuste fino semi-supervisado para la adaptación de LLM
SemiEvol: Semi-supervised Fine-tuning for LLM Adaptation
Junyu Luo, Xiao Luo, Xiusi Chen, Zhiping Xiao, Wei Ju, Ming Zhang
•
Oct 17, 2024
•
48
2
SAM2Long: Mejorando SAM 2 para la Segmentación de Videos Largos con un Árbol de Memoria sin Entrenamiento
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree
Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
•
Oct 21, 2024
•
69
2
Pangea: Un LLM Multilingüe Multimodal Totalmente Abierto para 39 Idiomas
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages
Xiang Yue, Yueqi Song, Akari Asai, Seungone Kim, Jean de Dieu Nyandwi, Simran Khanuja, Anjali Kantharuban, Lintang Sutawika, Sathyanarayanan Ramamoorthy, Graham Neubig
•
Oct 21, 2024
•
45
3
Aprendizaje por Refuerzo basado en Modelos sin Entrenamiento utilizando Modelos de Lenguaje Grandes
Zero-shot Model-based Reinforcement Learning using Large Language Models
Abdelhakim Benechehab, Youssef Attia El Hili, Ambroise Odonnat, Oussama Zekri, Albert Thomas, Giuseppe Paolo, Maurizio Filippone, Ievgen Redko, Balázs Kégl
•
Oct 15, 2024
•
9
4
Desintoxicación de Alucinaciones: Deserción Sensible de Neuronas (SeND) para el Entrenamiento de Modelos de Lenguaje Grandes
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training
Shahrad Mohammadzadeh, Juan David Guerra, Marco Bonizzato, Reihaneh Rabbany, Golnoosh Farnadi
•
Oct 20, 2024
•
1
2
Autoevaluación Cruzada para Evaluar LLMs Multilingües
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs
Sumanth Doddapaneni, Mohammed Safi Ur Rahman Khan, Dilip Venkatesh, Raj Dabre, Anoop Kunchukuttan, Mitesh M. Khapra
•
Oct 17, 2024
•
1
2
RM-Bench: Evaluación comparativa de modelos de recompensa de modelos de lenguaje con sutileza y estilo
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style
Yantao Liu, Zijun Yao, Rui Min, Yixin Cao, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
24
2
DM-Codec: Destilando Representaciones Multimodales para la Tokenización del Habla
DM-Codec: Distilling Multimodal Representations for Speech Tokenization
Md Mubtasim Ahasan, Md Fahim, Tasnim Mohiuddin, A K M Mahbubur Rahman, Aman Chadha, Tariq Iqbal, M Ashraful Amin, Md Mofijul Islam, Amin Ahsan Ali
•
Oct 19, 2024
•
2
2
¿Cuántos Van Goghs se necesitan para Van Goghear? Encontrando el Umbral de Imitación
How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold
Sahil Verma, Royi Rassin, Arnav Das, Gantavya Bhatt, Preethi Seshadri, Chirag Shah, Jeff Bilmes, Hannaneh Hajishirzi, Yanai Elazar
•
Oct 19, 2024
•
6
3
CBT-Bench: Evaluación de Modelos de Lenguaje Grandes en la Asistencia de la Terapia Cognitivo-Conductual
CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy
Mian Zhang, Xianjun Yang, Xinlu Zhang, Travis Labrum, Jamie C. Chiu, Shaun M. Eack, Fei Fang, William Yang Wang, Zhiyu Zoey Chen
•
Oct 17, 2024
•
4
2
Ajuste de Enrutador: Un Enfoque Simple y Efectivo para Habilitar la Profundidad Dinámica en Transformadores
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers
Shwai He, Tao Ge, Guoheng Sun, Bowei Tian, Xiaoyang Wang, Ang Li, Dong Yu
•
Oct 17, 2024
•
3
2
Informe Técnico de Alineación Baichuan
Baichuan Alignment Technical Report
Mingan Lin, Fan Yang, Yanjun Shen, Haoze Sun, Tianpeng Li, Tao Zhang, Chenzheng Zhu, Tao Zhang, Miao Zheng, Xu Li, Yijie Zhou, Mingyang Chen, Yanzhao Qin, Youquan Li, Hao Liang, Fei Li, Yadong Li, Mang Wang, Guosheng Dong, Kun Fang, Jianhua Xu, Bin Cui, Wentao Zhang, Zenan Zhou, Weipeng Chen
•
Oct 19, 2024
•
52
2
Alquimia: Ampliando la Capacidad de Demostración de Teoremas a través de la Mutación Simbólica
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation
Shaonan Wu, Shuai Lu, Yeyun Gong, Nan Duan, Ping Wei
•
Oct 21, 2024
•
13
3
Destilación de pre-entrenamiento para modelos de lenguaje grandes: una exploración del espacio de diseño
Pre-training Distillation for Large Language Models: A Design Space Exploration
Hao Peng, Xin Lv, Yushi Bai, Zijun Yao, Jiajie Zhang, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
16
2
Selección de Muestras Influyentes para la Alineación de Contextos Largos a través de la Orientación de Modelos Homólogos y la Medición de la Conciencia Contextual.
Selecting Influential Samples for Long Context Alignment via Homologous Models' Guidance and Contextual Awareness Measurement
Shuzheng Si, Haozhe Zhao, Gang Chen, Yunshui Li, Kangyang Luo, Chuancheng Lv, Kaikai An, Fanchao Qi, Baobao Chang, Maosong Sun
•
Oct 21, 2024
•
7
3
Agente-a-Simulación: Aprendizaje de Modelos de Comportamiento Interactivo a partir de Videos Longitudinales Informales
Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos
Gengshan Yang, Andrea Bajcsy, Shunsuke Saito, Angjoo Kanazawa
•
Oct 21, 2024
•
5
2
Meta-Chunkeo: Aprendizaje de la Segmentación Eficiente de Texto a través de la Percepción Lógica
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception
Jihao Zhao, Zhiyuan Ji, Pengnian Qi, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Oct 16, 2024
•
24
4
FrugalNeRF: Convergencia rápida para síntesis de vistas novedosas con pocas tomas sin Priors Aprendidos
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors
Chin-Yang Lin, Chung-Ho Wu, Chang-Han Yeh, Shih-Han Yen, Cheng Sun, Yu-Lun Liu
•
Oct 21, 2024
•
84
2
CompassJudger-1: Modelo de Juez Todo en Uno Ayuda en la Evaluación y Evolución del Modelo
CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution
Maosong Cao, Alexander Lam, Haodong Duan, Hongwei Liu, Songyang Zhang, Kai Chen
•
Oct 21, 2024
•
61
2
Aprendizaje en contexto y la navaja de Occam
In-context learning and Occam's razor
Eric Elmoznino, Tom Marty, Tejas Kasetty, Leo Gagnon, Sarthak Mittal, Mahan Fathi, Dhanya Sridhar, Guillaume Lajoie
•
Oct 17, 2024
•
2
2