ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
December 23rd, 2024
Domando o Treinamento Conjunto Multimodal para uma Síntese de Vídeo para Áudio de Alta Qualidade
Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis
Ho Kei Cheng, Masato Ishii, Akio Hayakawa, Takashi Shibuya, Alexander Schwing, Yuki Mitsufuji
•
Dec 19, 2024
•
18
2
TRecViT: Um Transformador de Vídeo Recorrente
TRecViT: A Recurrent Video Transformer
Viorica Pătrăucean, Xu Owen He, Joseph Heyward, Chuhan Zhang, Mehdi S. M. Sajjadi, George-Cristian Muraru, Artem Zholus, Mahdi Karami, Ross Goroshin, Yutian Chen, Simon Osindero, João Carreira, Razvan Pascanu
•
Dec 18, 2024
•
13
4
Fietje: Um LLM aberto e eficiente para o holandês
Fietje: An open, efficient LLM for Dutch
Bram Vanroy
•
Dec 19, 2024
•
4
3
Sumarização de Texto Multi-LLM
Multi-LLM Text Summarization
Jiangnan Fang, Cheng-Tse Liu, Jieun Kim, Yash Bhedaru, Ethan Liu, Nikhil Singh, Nedim Lipka, Puneet Mathur, Nesreen K. Ahmed, Franck Dernoncourt, Ryan A. Rossi, Hanieh Deilamsalehy
•
Dec 20, 2024
•
6
2
CLEAR: Linearização semelhante a convolução reverte Transformadores de Difusão Pré-Treinados Acima
CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up
Songhua Liu, Zhenxiong Tan, Xinchao Wang
•
Dec 20, 2024
•
23
5
Geração Visual Autoregressiva Paralelizada
Parallelized Autoregressive Visual Generation
Yuqing Wang, Shuhuai Ren, Zhijie Lin, Yujin Han, Haoyuan Guo, Zhenheng Yang, Difan Zou, Jiashi Feng, Xihui Liu
•
Dec 19, 2024
•
54
2
Aprendizagem por Reforço Offline para Raciocínio de Múltiplas Etapas em LLM
Offline Reinforcement Learning for LLM Multi-Step Reasoning
Huaijie Wang, Shibo Hao, Hanze Dong, Shenao Zhang, Yilin Bao, Ziran Yang, Yi Wu
•
Dec 20, 2024
•
39
6
A Ordem das Sequências Importa: Aproveitando Modelos de Vídeo na Super-Resolução 3D
Sequence Matters: Harnessing Video Models in 3D Super-Resolution
Hyun-kyu Ko, Dongheok Park, Youngin Park, Byeonghyeon Lee, Juhee Han, Eunbyung Park
•
Dec 16, 2024
•
11
2
MixLLM: Quantização LLM com Mistura de Precisão Global entre Características de Saída e Design de Sistema Altamente Eficiente
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design
Zhen Zheng, Xiaonan Song, Chuanjie Liu
•
Dec 19, 2024
•
14
5
IDOL: Criação Humana 3D Instantânea e Fotorrealista a partir de uma Única Imagem
IDOL: Instant Photorealistic 3D Human Creation from a Single Image
Yiyu Zhuang, Jiaxi Lv, Hao Wen, Qing Shuai, Ailing Zeng, Hao Zhu, Shifeng Chen, Yujiu Yang, Xun Cao, Wei Liu
•
Dec 19, 2024
•
6
2
Rumo a Legendas de Imagens Hiper-Detalhadas Robustas: Uma Abordagem Multiagente e Métricas de Avaliação Dupla para Factualidade e Cobertura
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage
Saehyung Lee, Seunghyun Yoon, Trung Bui, Jing Shi, Sungroh Yoon
•
Dec 20, 2024
•
15
2
LLMs Perdidos na Tradução: M-ALERT revela Lacunas de Segurança Cross-Linguísticas
LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Gaps
Felix Friedrich, Simone Tedeschi, Patrick Schramowski, Manuel Brack, Roberto Navigli, Huu Nguyen, Bo Li, Kristian Kersting
•
Dec 19, 2024
•
4
3
ESCALA: Otimização da Compressão de Cache Chave-Valor na Geração de Contexto Longo
SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation
Jialong Wu, Zhenglin Wang, Linhai Zhang, Yilong Lai, Yulan He, Deyu Zhou
•
Dec 18, 2024
•
20
3