ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
October 2nd, 2024
Embodied-RAG: Memória Corporificada Geral Não-paramétrica para Recuperação e Geração
Embodied-RAG: General non-parametric Embodied Memory for Retrieval and Generation
Quanting Xie, So Yeon Min, Tianyi Zhang, Aarav Bajaj, Ruslan Salakhutdinov, Matthew Johnson-Roberson, Yonatan Bisk
•
Sep 26, 2024
•
3
2
Um Token para Segmentá-los Todos: Segmentação de Raciocínio Instruída por Linguagem em Vídeos
One Token to Seg Them All: Language Instructed Reasoning Segmentation in Videos
Zechen Bai, Tong He, Haiyang Mei, Pichao Wang, Ziteng Gao, Joya Chen, Lei Liu, Zheng Zhang, Mike Zheng Shou
•
Sep 29, 2024
•
19
3
Flex3D: Geração 3D Feed-Forward com Modelo de Reconstrução Flexível e Curadoria de Visualização de Entrada
Flex3D: Feed-Forward 3D Generation With Flexible Reconstruction Model And Input View Curation
Junlin Han, Jianyuan Wang, Andrea Vedaldi, Philip Torr, Filippos Kokkinos
•
Oct 1, 2024
•
20
5
TPI-LLM: Servindo LLMs em Escala de 70 bilhões Eficientemente em Dispositivos de Borda com Recursos Limitados
TPI-LLM: Serving 70B-scale LLMs Efficiently on Low-resource Edge Devices
Zonghang Li, Wenjiao Feng, Mohsen Guizani, Hongfang Yu
•
Oct 1, 2024
•
33
8
ACE: Criador e Editor Versátil Seguindo Instruções via Difusão Transformer
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer
Zhen Han, Zeyinzi Jiang, Yulin Pan, Jingfeng Zhang, Chaojie Mao, Chenwei Xie, Yu Liu, Jingren Zhou
•
Sep 30, 2024
•
12
2
SyntheOcc: Sintetizar Imagens do Street View Controladas Geometricamente por meio de MPIs Semânticos 3D
SyntheOcc: Synthesize Geometric-Controlled Street View Images through 3D Semantic MPIs
Leheng Li, Weichao Qiu, Yingjie Cai, Xu Yan, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 1, 2024
•
11
2
DressRecon: Reconstrução Humana 4D Livre de Formato a partir de Vídeo Monocular
DressRecon: Freeform 4D Human Reconstruction from Monocular Video
Jeff Tan, Donglai Xiang, Shubham Tulsiani, Deva Ramanan, Gengshan Yang
•
Sep 30, 2024
•
9
2
Qual o Dano? Quantificando o Impacto Tangível do Viés de Gênero na Tradução Automática com um Estudo Centrado no Humano
What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study
Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof, Luisa Bentivogli
•
Oct 1, 2024
•
5
2
Lei do Elo Mais Fraco: Capacidades Cruzadas de Modelos de Linguagem Grandes
Law of the Weakest Link: Cross Capabilities of Large Language Models
Ming Zhong, Aston Zhang, Xuewei Wang, Rui Hou, Wenhan Xiong, Chenguang Zhu, Zhengxing Chen, Liang Tan, Chloe Bi, Mike Lewis, Sravya Popuri, Sharan Narang, Melanie Kambadur, Dhruv Mahajan, Sergey Edunov, Jiawei Han, Laurens van der Maaten
•
Sep 30, 2024
•
55
2
Atlas-Chat: Adaptação de Modelos de Linguagem Grandes para o Dialeto Árabe Marroquino de Recursos Limitados
Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect
Guokan Shang, Hadi Abdine, Yousef Khoubrane, Amr Mohamed, Yassine Abbahaddou, Sofiane Ennadir, Imane Momayiz, Xuguang Ren, Eric Moulines, Preslav Nakov, Michalis Vazirgiannis, Eric Xing
•
Sep 26, 2024
•
29
2
Extensão da Janela de Contexto Visual: Uma Nova Perspectiva para a Compreensão de Vídeos Longos
Visual Context Window Extension: A New Perspective for Long Video Understanding
Hongchen Wei, Zhenzhong Chen
•
Sep 30, 2024
•
11
2
Fluxo Retificado da Média Posterior: Rumo à Restauração de Imagens Foto-realistas com Mínimo Erro Quadrático Médio
Posterior-Mean Rectified Flow: Towards Minimum MSE Photo-Realistic Image Restoration
Guy Ohayon, Tomer Michaeli, Michael Elad
•
Oct 1, 2024
•
10
3
Ilustre: um Modelo Aberto Avançado de Ilustração
Illustrious: an Open Advanced Illustration Model
Sang Hyun Park, Jun Young Koh, Junha Lee, Joy Song, Dongha Kim, Hoyeon Moon, Hyunju Lee, Min Song
•
Sep 30, 2024
•
16
3
CãozinhoBot Auxiliar: Busca de Objetos em Ambientes Abertos usando Robôs com Pernas e Modelos de Visão-Linguagem
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models
Qi Wu, Zipeng Fu, Xuxin Cheng, Xiaolong Wang, Chelsea Finn
•
Sep 30, 2024
•
8
2