ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
October 22nd, 2024
PUMA: Capacitando MLLM Unificado com Geração Visual Multigranular
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation
Rongyao Fang, Chengqi Duan, Kun Wang, Hao Li, Hao Tian, Xingyu Zeng, Rui Zhao, Jifeng Dai, Hongsheng Li, Xihui Liu
•
Oct 17, 2024
•
57
3
AutoTrain: Treinamento sem código para modelos de última geração
AutoTrain: No-code training for state-of-the-art models
Abhishek Thakur
•
Oct 21, 2024
•
60
2
Ichigo: Assistente de Voz em Tempo Real de Fusão Antecipada Multimodal
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant
Alan Dao, Dinh Bach Vu, Huy Hoang Ha
•
Oct 20, 2024
•
11
5
SemiEvol: Ajuste Fino Semi-supervisionado para Adaptação de LLM
SemiEvol: Semi-supervised Fine-tuning for LLM Adaptation
Junyu Luo, Xiao Luo, Xiusi Chen, Zhiping Xiao, Wei Ju, Ming Zhang
•
Oct 17, 2024
•
48
2
SAM2Long: Melhorando o SAM 2 para Segmentação Longa de Vídeos com uma Árvore de Memória sem Treinamento.
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree
Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
•
Oct 21, 2024
•
69
2
Pangea: Um LLM Multilíngue Multimodal Totalmente Aberto para 39 Idiomas
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages
Xiang Yue, Yueqi Song, Akari Asai, Seungone Kim, Jean de Dieu Nyandwi, Simran Khanuja, Anjali Kantharuban, Lintang Sutawika, Sathyanarayanan Ramamoorthy, Graham Neubig
•
Oct 21, 2024
•
45
3
Aprendizagem por Reforço Baseada em Modelos sem Treinamento usando Modelos de Linguagem de Grande Escala
Zero-shot Model-based Reinforcement Learning using Large Language Models
Abdelhakim Benechehab, Youssef Attia El Hili, Ambroise Odonnat, Oussama Zekri, Albert Thomas, Giuseppe Paolo, Maurizio Filippone, Ievgen Redko, Balázs Kégl
•
Oct 15, 2024
•
9
4
Desintoxicação de Alucinações: Desativação Sensível de Neurônios (SeND) para Treinamento de Modelos de Linguagem de Grande Escala
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training
Shahrad Mohammadzadeh, Juan David Guerra, Marco Bonizzato, Reihaneh Rabbany, Golnoosh Farnadi
•
Oct 20, 2024
•
1
2
Avaliação Automática Cruzada para Avaliar Modelos de Linguagem Multilíngue
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs
Sumanth Doddapaneni, Mohammed Safi Ur Rahman Khan, Dilip Venkatesh, Raj Dabre, Anoop Kunchukuttan, Mitesh M. Khapra
•
Oct 17, 2024
•
1
2
RM-Bench: Avaliando Modelos de Recompensa de Modelos de Linguagem com Subtileza e Estilo
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style
Yantao Liu, Zijun Yao, Rui Min, Yixin Cao, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
24
2
DM-Codec: Destilação de Representações Multimodais para Tokenização de Fala
DM-Codec: Distilling Multimodal Representations for Speech Tokenization
Md Mubtasim Ahasan, Md Fahim, Tasnim Mohiuddin, A K M Mahbubur Rahman, Aman Chadha, Tariq Iqbal, M Ashraful Amin, Md Mofijul Islam, Amin Ahsan Ali
•
Oct 19, 2024
•
2
2
Quantos Van Goghs são necessários para Van Goghar? Encontrando o Limiar de Imitação
How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold
Sahil Verma, Royi Rassin, Arnav Das, Gantavya Bhatt, Preethi Seshadri, Chirag Shah, Jeff Bilmes, Hannaneh Hajishirzi, Yanai Elazar
•
Oct 19, 2024
•
6
3
CBT-Bench: Avaliando Modelos de Linguagem Grandes na Assistência à Terapia Cognitivo-Comportamental
CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy
Mian Zhang, Xianjun Yang, Xinlu Zhang, Travis Labrum, Jamie C. Chiu, Shaun M. Eack, Fei Fang, William Yang Wang, Zhiyu Zoey Chen
•
Oct 17, 2024
•
4
2
Ajuste de Roteador: Uma Abordagem Simples e Eficaz para Habilitar Profundidade Dinâmica em Transformadores
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers
Shwai He, Tao Ge, Guoheng Sun, Bowei Tian, Xiaoyang Wang, Ang Li, Dong Yu
•
Oct 17, 2024
•
3
2
Relatório Técnico de Alinhamento Baichuan
Baichuan Alignment Technical Report
Mingan Lin, Fan Yang, Yanjun Shen, Haoze Sun, Tianpeng Li, Tao Zhang, Chenzheng Zhu, Tao Zhang, Miao Zheng, Xu Li, Yijie Zhou, Mingyang Chen, Yanzhao Qin, Youquan Li, Hao Liang, Fei Li, Yadong Li, Mang Wang, Guosheng Dong, Kun Fang, Jianhua Xu, Bin Cui, Wentao Zhang, Zenan Zhou, Weipeng Chen
•
Oct 19, 2024
•
52
2
Alquimia: Ampliando a Capacidade de Prova de Teoremas por meio de Mutação Simbólica
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation
Shaonan Wu, Shuai Lu, Yeyun Gong, Nan Duan, Ping Wei
•
Oct 21, 2024
•
13
3
Destilação de Pré-treinamento para Modelos de Linguagem Grandes: Uma Exploração do Espaço de Design
Pre-training Distillation for Large Language Models: A Design Space Exploration
Hao Peng, Xin Lv, Yushi Bai, Zijun Yao, Jiajie Zhang, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
16
2
Seleção de Amostras Influentes para Alinhamento de Contexto Longo por meio da Orientação de Modelos Homólogos e Medição da Consciência Contextual.
Selecting Influential Samples for Long Context Alignment via Homologous Models' Guidance and Contextual Awareness Measurement
Shuzheng Si, Haozhe Zhao, Gang Chen, Yunshui Li, Kangyang Luo, Chuancheng Lv, Kaikai An, Fanchao Qi, Baobao Chang, Maosong Sun
•
Oct 21, 2024
•
7
3
Agente-para-Sim: Aprendizado de Modelos de Comportamento Interativo a partir de Vídeos Longitudinais Informais.
Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos
Gengshan Yang, Andrea Bajcsy, Shunsuke Saito, Angjoo Kanazawa
•
Oct 21, 2024
•
5
2
Meta-Chunking: Aprendizado de Segmentação de Texto Eficiente por meio de Percepção Lógica
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception
Jihao Zhao, Zhiyuan Ji, Pengnian Qi, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Oct 16, 2024
•
24
4
FrugalNeRF: Convergência Rápida para Síntese de Novas Visualizações com Poucas Imagens sem Priors Aprendidos
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors
Chin-Yang Lin, Chung-Ho Wu, Chang-Han Yeh, Shih-Han Yen, Cheng Sun, Yu-Lun Liu
•
Oct 21, 2024
•
84
2
CompassJudger-1: Modelo de Juiz Tudo-em-Um Auxilia na Avaliação e Evolução do Modelo
CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution
Maosong Cao, Alexander Lam, Haodong Duan, Hongwei Liu, Songyang Zhang, Kai Chen
•
Oct 21, 2024
•
61
2
Aprendizado em contexto e Navalha de Occam
In-context learning and Occam's razor
Eric Elmoznino, Tom Marty, Tejas Kasetty, Leo Gagnon, Sarthak Mittal, Mahan Fathi, Dhanya Sridhar, Guillaume Lajoie
•
Oct 17, 2024
•
2
2