ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
August 26th, 2024
Construção e melhor compreensão de modelos visão-linguagem: insights e direções futuras
Building and better understanding vision-language models: insights and future directions
Hugo Laurençon, Andrés Marafioti, Victor Sanh, Léo Tronchon
•
Aug 22, 2024
•
131
5
MME-RealWorld: Será que seu LLM Multimodal pode desafiar cenários do mundo real de alta resolução que são difíceis para os humanos?
MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?
Yi-Fan Zhang, Huanyu Zhang, Haochen Tian, Chaoyou Fu, Shuangqing Zhang, Junfei Wu, Feng Li, Kun Wang, Qingsong Wen, Zhang Zhang, Liang Wang, Rong Jin, Tieniu Tan
•
Aug 23, 2024
•
27
4
LayerPano3D: Panorama 3D em Camadas para Geração de Cenas Hiperimersivas
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation
Shuai Yang, Jing Tan, Mengchen Zhang, Tong Wu, Yixuan Li, Gordon Wetzstein, Ziwei Liu, Dahua Lin
•
Aug 23, 2024
•
27
2
O Gradiente dos Transformadores de Múltiplas Camadas Pode ser Aproximado em Quase Tempo Linear.
Multi-Layer Transformers Gradient Can be Approximated in Almost Linear Time
Yingyu Liang, Zhizhou Sha, Zhenmei Shi, Zhao Song, Yufa Zhou
•
Aug 23, 2024
•
25
4
Treinamento eficiente em memória com Descida de Subespaço Online para LLM.
Memory-Efficient LLM Training with Online Subspace Descent
Kaizhao Liang, Bo Liu, Lizhang Chen, Qiang Liu
•
Aug 23, 2024
•
14
3
T3M: Síntese de Movimento Humano 3D Guiada por Texto a partir da Fala
T3M: Text Guided 3D Human Motion Synthesis from Speech
Wenshuo Peng, Kaipeng Zhang, Sai Qian Zhang
•
Aug 23, 2024
•
13
2
CustomCrafter: Geração Personalizada de Vídeo com Preservação de Movimento e Habilidades de Composição de Conceitos
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities
Tao Wu, Yong Zhang, Xintao Wang, Xianpan Zhou, Guangcong Zheng, Zhongang Qi, Ying Shan, Xi Li
•
Aug 23, 2024
•
12
2
HiRED: Eliminação de Tokens Guiada por Atenção para Inferência Eficiente de Modelos de Visão-Linguagem de Alta Resolução em Ambientes com Restrição de Recursos
HiRED: Attention-Guided Token Dropping for Efficient Inference of High-Resolution Vision-Language Models in Resource-Constrained Environments
Kazi Hasan Ibn Arif, JinYi Yoon, Dimitrios S. Nikolopoulos, Hans Vandierendonck, Deepu John, Bo Ji
•
Aug 20, 2024
•
11
2
Uma Solução Baseada na Web para Aprendizado Federado com Automação Baseada em LLM.
A Web-Based Solution for Federated Learning with LLM-Based Automation
Chamith Mawela, Chaouki Ben Issaid, Mehdi Bennis
•
Aug 23, 2024
•
10
1
FLoD: Integrando Níveis Flexíveis de Detalhe na Splatting Gaussiana 3D para Renderização Personalizável
FLoD: Integrating Flexible Level of Detail into 3D Gaussian Splatting for Customizable Rendering
Yunji Seo, Young Sun Choi, Hyun Seung Son, Youngjung Uh
•
Aug 23, 2024
•
6
2
Mesa Redonda: Alavancando Esquema Dinâmico e Autocompletar Contextual para Aumentar a Precisão da Consulta em Perguntas e Respostas Tabulares
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering
Pratyush Kumar, Kuber Vijaykumar Bellad, Bharat Vadlamudi, Aman Chadha
•
Aug 22, 2024
•
5
1
Código: Edição de Equações Diferenciais Ordinárias Confiante
CODE: Confident Ordinary Differential Editing
Bastien van Delft, Tommaso Martorella, Alexandre Alahi
•
Aug 22, 2024
•
4
2