ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
December 17th, 2024
SplineGS: Spline Robusto Adaptativo ao Movimento para Gaussiana 3D Dinâmica em Tempo Real a partir de Vídeo Monocular
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello, Jaeho Moon, Jihyong Oh, Munchurl Kim
•
Dec 13, 2024
•
7
3
Whisper-GPT: Um Modelo de Linguagem Grande de Áudio com Representação Híbrida
Whisper-GPT: A Hybrid Representation Audio Large Language Model
Prateek Verma
•
Dec 16, 2024
•
4
2
MaxInfoRL: Impulsionando a exploração em aprendizado por reforço através da maximização do ganho de informação
MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximization
Bhavya Sukhija, Stelian Coros, Andreas Krause, Pieter Abbeel, Carmelo Sferrazza
•
Dec 16, 2024
•
5
2
IDArb: Decomposição Intrínseca para um Número Arbitrário de Visualizações e Iluminações de Entrada
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations
Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin
•
Dec 16, 2024
•
12
2
Transformadores de Difusão Causal para Modelagem Generativa
Causal Diffusion Transformers for Generative Modeling
Chaorui Deng, Deyao Zh, Kunchang Li, Shi Guan, Haoqi Fan
•
Dec 16, 2024
•
23
3
Modelos de Linguagem Menores São Melhores Evolucionadores de Instruções
Smaller Language Models Are Better Instruction Evolvers
Tingfeng Hui, Lulu Zhao, Guanting Dong, Yaqi Zhang, Hua Zhou, Sen Su
•
Dec 15, 2024
•
29
2
SPaR: Autojogo com Refinamento de Busca em Árvore para Melhorar o Seguimento de Instruções em Modelos de Linguagem Grandes
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models
Jiale Cheng, Xiao Liu, Cunxiang Wang, Xiaotao Gu, Yida Lu, Dan Zhang, Yuxiao Dong, Jie Tang, Hongning Wang, Minlie Huang
•
Dec 16, 2024
•
18
2
VividFace: Um Framework Híbrido Baseado em Difusão para Troca de Rosto em Vídeo de Alta Fidelidade
VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping
Hao Shao, Shulun Wang, Yang Zhou, Guanglu Song, Dailan He, Shuo Qin, Zhuofan Zong, Bingqi Ma, Yu Liu, Hongsheng Li
•
Dec 15, 2024
•
12
2
Propriedade Gaussiana: Integrando Propriedades Físicas em Gaussiana 3D com LMMs
GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs
Xinli Xu, Wenhang Ge, Dicong Qiu, ZhiFei Chen, Dongyu Yan, Zhuoyun Liu, Haoyu Zhao, Hanfeng Zhao, Shunsi Zhang, Junwei Liang, Ying-Cong Chen
•
Dec 15, 2024
•
13
2
Apenas uma transformação simples é suficiente para proteção de dados em Aprendizado Federado Vertical.
Just a Simple Transformation is Enough for Data Protection in Vertical Federated Learning
Andrei Semenov, Philip Zmushko, Alexander Pichugin, Aleksandr Beznosikov
•
Dec 16, 2024
•
2
2
MOVIS: Melhorando a Síntese de Novas Visualizações de Múltiplos Objetos para Cenas Internas
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes
Ruijie Lu, Yixin Chen, Junfeng Ni, Baoxiong Jia, Yu Liu, Diwen Wan, Gang Zeng, Siyuan Huang
•
Dec 16, 2024
•
6
2
Matrizes Maravilhosas: Combinando para uma Arquitetura de Modelo Base mais Eficiente e Eficaz
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture
Jingze Shi, Bingheng Wu
•
Dec 16, 2024
•
8
2
Agente de Avaliação: Estrutura de Avaliação Eficiente e Acionável para Modelos Generativos Visuais
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models
Fan Zhang, Shulin Tian, Ziqi Huang, Yu Qiao, Ziwei Liu
•
Dec 10, 2024
•
37
2
DynamicScaler: Geração de Vídeo Contínua e Escalável para Cenas Panorâmicas
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes
Jinxiu Liu, Shaoheng Lin, Yinxiao Li, Ming-Hsuan Yang
•
Dec 15, 2024
•
7
2
TidyBot++: Um Manipulador Móvel Holonômico de Código Aberto para Aprendizado de Robôs
TidyBot++: An Open-Source Holonomic Mobile Manipulator for Robot Learning
Jimmy Wu, William Chong, Robert Holmberg, Aaditya Prasad, Yihuai Gao, Oussama Khatib, Shuran Song, Szymon Rusinkiewicz, Jeannette Bohg
•
Dec 11, 2024
•
5
2
RLDG: Destilação de Política Robótica Generalista via Aprendizado por Reforço
RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning
Charles Xu, Qiyang Li, Jianlan Luo, Sergey Levine
•
Dec 13, 2024
•
1
2
Leaderboards Confiáveis, Reproduzíveis e Realmente Rápidos com Evalica
Reliable, Reproducible, and Really Fast Leaderboards with Evalica
Dmitry Ustalov
•
Dec 15, 2024
•
2
2
Emma-X: Um Modelo de Ação Multimodal Incorporado com Cadeia Fundamentada de Pensamento e Raciocínio Espacial de Antecipação.
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning
Qi Sun, Pengfei Hong, Tej Deep Pala, Vernon Toh, U-Xuan Tan, Deepanway Ghosal, Soujanya Poria
•
Dec 16, 2024
•
9
2
Cabeça de Fios: Avatares de Cabeça 3D Desembaraçados em Fios Usando Priors Geométricos
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors
Xiaokun Sun, Zeyu Cai, Zhenyu Zhang, Ying Tai, Jian Yang
•
Dec 16, 2024
•
11
2
Proteção Quase sem Custo Contra a Imitação por Modelos de Difusão Personalizados
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models
Namhyuk Ahn, KiYoon Yoo, Wonhyuk Ahn, Daesik Kim, Seung-Hun Nam
•
Dec 16, 2024
•
2
2
A Vantagem do Código Aberto em Modelos de Linguagem Grandes (LLMs)
The Open Source Advantage in Large Language Models (LLMs)
Jiya Manchanda, Laura Boettcher, Matheus Westphalen, Jasser Jasser
•
Dec 16, 2024
•
10
2
País das Maravilhas: Navegando por Cenários 3D a partir de uma Única Imagem
Wonderland: Navigating 3D Scenes from a Single Image
Hanwen Liang, Junli Cao, Vidit Goel, Guocheng Qian, Sergei Korolev, Demetri Terzopoulos, Konstantinos N. Plataniotis, Sergey Tulyakov, Jian Ren
•
Dec 16, 2024
•
16
2
BrushEdit: Edição e Preenchimento de Imagens Tudo-em-Um
BrushEdit: All-In-One Image Inpainting and Editing
Yaowei Li, Yuxuan Bian, Xuan Ju, Zhaoyang Zhang, Ying Shan, Qiang Xu
•
Dec 13, 2024
•
35
3
ColorFlow: Colorização de Sequência de Imagens com Recuperação Auxiliada
ColorFlow: Retrieval-Augmented Image Sequence Colorization
Junhao Zhuang, Xuan Ju, Zhaoyang Zhang, Yong Liu, Shiyi Zhang, Chun Yuan, Ying Shan
•
Dec 16, 2024
•
26
4
Transformador Latente de Byte: Patches Escalam Melhor do que Tokens
Byte Latent Transformer: Patches Scale Better Than Tokens
Artidoro Pagnoni, Ram Pasunuru, Pedro Rodriguez, John Nguyen, Benjamin Muller, Margaret Li, Chunting Zhou, Lili Yu, Jason Weston, Luke Zettlemoyer, Gargi Ghosh, Mike Lewis, Ari Holtzman, Srinivasan Iyer
•
Dec 13, 2024
•
102
8
GeoX: Resolução de Problemas Geométricos Através do Pré-treinamento Unificado Formalizado de Visão e Linguagem
GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training
Renqiu Xia, Mingsheng Li, Hancheng Ye, Wenjie Wu, Hongbin Zhou, Jiakang Yuan, Tianshuo Peng, Xinyu Cai, Xiangchao Yan, Bin Wang, Conghui He, Botian Shi, Tao Chen, Junchi Yan, Bo Zhang
•
Dec 16, 2024
•
4
2
SepLLM: Acelerar Modelos de Linguagem Grandes Comprimindo Um Segmento em Um Separador
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator
Guoxuan Chen, Han Shi, Jiawei Li, Yihang Gao, Xiaozhe Ren, Yimeng Chen, Xin Jiang, Zhenguo Li, Weiyang Liu, Chao Huang
•
Dec 16, 2024
•
11
5
RetroLLM: Capacitando Modelos de Linguagem de Grande Escala para Recuperar Evidências Detalhadas durante a Geração
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yongkang Wu, Zhonghua Li, Qi Ye, Zhicheng Dou
•
Dec 16, 2024
•
37
4