ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
September 4th, 2024
ReceitaLonga: Receita para Generalização Eficiente de Contexto Longo em Modelos de Linguagem Grandes
LongRecipe: Recipe for Efficient Long Context Generalization in Large Languge Models
Zhiyuan Hu, Yuliang Liu, Jinman Zhao, Suyuchen Wang, Yan Wang, Wei Shen, Qing Gu, Anh Tuan Luu, See-Kiong Ng, Zhiwei Jiang, Bryan Hooi
•
Aug 31, 2024
•
42
2
OD-VAE: Um Compressor de Vídeo Omnidimensional para Melhorar o Modelo de Difusão de Vídeo Latente
OD-VAE: An Omni-dimensional Video Compressor for Improving Latent Video Diffusion Model
Liuhan Chen, Zongjian Li, Bin Lin, Bin Zhu, Qian Wang, Shenghai Yuan, Xing Zhou, Xinghua Cheng, Li Yuan
•
Sep 2, 2024
•
14
2
DepthCrafter: Gerando Sequências Longas e Coerentes de Profundidade para Vídeos de Mundo Aberto
DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos
Wenbo Hu, Xiangjun Gao, Xiaoyu Li, Sijie Zhao, Xiaodong Cun, Yong Zhang, Long Quan, Ying Shan
•
Sep 3, 2024
•
37
3
Siga-Sua-Tela: Preenchimento de Vídeo de Alta Resolução com Geração de Conteúdo Extensiva
Follow-Your-Canvas: Higher-Resolution Video Outpainting with Extensive Content Generation
Qihua Chen, Yue Ma, Hongfa Wang, Junkun Yuan, Wenzhe Zhao, Qi Tian, Hongmei Wang, Shaobo Min, Qifeng Chen, Wei Liu
•
Sep 2, 2024
•
6
2
Geração de Vídeo Consciente em 3D de forma Composicional com Diretor LLM
Compositional 3D-aware Video Generation with LLM Director
Hanxin Zhu, Tianyu He, Anni Tang, Junliang Guo, Zhibo Chen, Jiang Bian
•
Aug 31, 2024
•
15
2
VideoLLaMB: Compreensão de Vídeo de Longo Contexto com Memória Recorrente
VideoLLaMB: Long-context Video Understanding with Recurrent Memory Bridges
Yuxuan Wang, Cihang Xie, Yang Liu, Zilong Zheng
•
Sep 2, 2024
•
28
6
Compressão precisa de modelos de difusão texto-imagem via Quantização de Vetores
Accurate Compression of Text-to-Image Diffusion Models via Vector Quantization
Vage Egiazarian, Denis Kuznedelev, Anton Voronov, Ruslan Svirschevski, Michael Goin, Daniil Pavlov, Dan Alistarh, Dmitry Baranchuk
•
Aug 31, 2024
•
11
2
OLMoE: Modelos de Linguagem de Mistura de Especialistas Abertos
OLMoE: Open Mixture-of-Experts Language Models
Niklas Muennighoff, Luca Soldaini, Dirk Groeneveld, Kyle Lo, Jacob Morrison, Sewon Min, Weijia Shi, Pete Walsh, Oyvind Tafjord, Nathan Lambert, Yuling Gu, Shane Arora, Akshita Bhagia, Dustin Schwenk, David Wadden, Alexander Wettig, Binyuan Hui, Tim Dettmers, Douwe Kiela, Ali Farhadi, Noah A. Smith, Pang Wei Koh, Amanpreet Singh, Hannaneh Hajishirzi
•
Sep 3, 2024
•
80
4
LinFusion: 1 GPU, 1 Minuto, Imagem de 16K
LinFusion: 1 GPU, 1 Minute, 16K Image
Songhua Liu, Weihao Yu, Zhenxiong Tan, Xinchao Wang
•
Sep 3, 2024
•
35
4
Kvasir-VQA: Um Conjunto de Dados de Pares Texto-Imagem do Trato Gastrointestinal
Kvasir-VQA: A Text-Image Pair GI Tract Dataset
Sushant Gautam, Andrea Storås, Cise Midoglu, Steven A. Hicks, Vajira Thambawita, Pål Halvorsen, Michael A. Riegler
•
Sep 2, 2024
•
72
2
Otimização de Política de Difusão
Diffusion Policy Policy Optimization
Allen Z. Ren, Justin Lidard, Lars L. Ankile, Anthony Simeonov, Pulkit Agrawal, Anirudha Majumdar, Benjamin Burchfiel, Hongkai Dai, Max Simchowitz
•
Sep 1, 2024
•
21
2
Rede de Fala com Atenção Adaptativa à Densidade: Melhorando a Compreensão de Características para Transtornos de Saúde Mental
Density Adaptive Attention-based Speech Network: Enhancing Feature Understanding for Mental Health Disorders
Georgios Ioannides, Adrian Kieback, Aman Chadha, Aaron Elkins
•
Aug 31, 2024
•
4
3
PrivacyLens: Avaliando a Consciência das Normas de Privacidade dos Modelos de Linguagem em Ação
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action
Yijia Shao, Tianshi Li, Weiyan Shi, Yanchen Liu, Diyi Yang
•
Aug 29, 2024
•
1
2
ContextoCitar: Atribuindo a Geração do Modelo ao Contexto
ContextCite: Attributing Model Generation to Context
Benjamin Cohen-Wang, Harshay Shah, Kristian Georgiev, Aleksander Madry
•
Sep 1, 2024
•
14
3
GenAgent: Construa Sistemas de IA Colaborativos com Fluxo de Trabalho Automatizado Geração - Estudos de Caso sobre ComfyUI
GenAgent: Build Collaborative AI Systems with Automated Workflow Generation -- Case Studies on ComfyUI
Xiangyuan Xue, Zeyu Lu, Di Huang, Wanli Ouyang, Lei Bai
•
Sep 2, 2024
•
9
3
Saber Quando Fundir: Investigando a Recuperação Híbrida em Não Inglês no Domínio Legal
Know When to Fuse: Investigating Non-English Hybrid Retrieval in the Legal Domain
Antoine Louis, Gijs van Dijck, Gerasimos Spanakis
•
Sep 2, 2024
•
3
2
Teoria Geral de OCR: Rumo ao OCR-2.0 por meio de um Modelo Unificado de Ponta a Ponta
General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model
Haoran Wei, Chenglong Liu, Jinyue Chen, Jia Wang, Lingyu Kong, Yanming Xu, Zheng Ge, Liang Zhao, Jianjian Sun, Yuang Peng, Chunrui Han, Xiangyu Zhang
•
Sep 3, 2024
•
85
9
FLUX que Toca Música
FLUX that Plays Music
Zhengcong Fei, Mingyuan Fan, Changqian Yu, Junshi Huang
•
Sep 1, 2024
•
34
2
O Conjunto de Dados MERIT: Modelagem e Renderização Eficiente de Transcrições Interpretáveis
The MERIT Dataset: Modelling and Efficiently Rendering Interpretable Transcripts
I. de Rodrigo, A. Sanchez-Cuadrado, J. Boal, A. J. Lopez-Lopez
•
Aug 31, 2024
•
2
2