ChatPaper.ai
Abrir Menu
Início
Artigos do Dia
arXiv
HuggingFace
Preços
Conta
Área de trabalho
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Artigos de Pesquisa em IA Diários
Artigos de pesquisa em IA selecionados diariamente com traduções
December 10th, 2024
Desvendando a Complexidade da Memória em Agentes de RL: uma Abordagem para Classificação e Avaliação
Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation
Egor Cherepanov, Nikita Kachaev, Artem Zholus, Alexey K. Kovalev, Aleksandr I. Panov
•
Dec 9, 2024
•
73
2
OmniDocBench: Avaliação de Análise de Documentos PDF Diversos com Anotações Abrangentes
OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations
Linke Ouyang, Yuan Qu, Hongbin Zhou, Jiawei Zhu, Rui Zhang, Qunshu Lin, Bin Wang, Zhiyuan Zhao, Man Jiang, Xiaomeng Zhao, Jin Shi, Fan Wu, Pei Chu, Minghao Liu, Zhenxiang Li, Chao Xu, Bo Zhang, Botian Shi, Zhongying Tu, Conghui He
•
Dec 10, 2024
•
11
1
Divot: Difusão Potencializa o Tokenizador de Vídeo para Compreensão e Geração
Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation
Yuying Ge, Yizhuo Li, Yixiao Ge, Ying Shan
•
Dec 5, 2024
•
16
2
Gaussianas de MAtCha: Atlas de Gráficos para Geometria de Alta Qualidade e Fotorrealismo a Partir de Vistas Esparsas
MAtCha Gaussians: Atlas of Charts for High-Quality Geometry and Photorealism From Sparse Views
Antoine Guédon, Tomoki Ichikawa, Kohei Yamashita, Ko Nishino
•
Dec 9, 2024
•
7
2
ProcessBench: Identificação de Erros de Processo no Raciocínio Matemático
ProcessBench: Identifying Process Errors in Mathematical Reasoning
Chujie Zheng, Zhenru Zhang, Beichen Zhang, Runji Lin, Keming Lu, Bowen Yu, Dayiheng Liu, Jingren Zhou, Junyang Lin
•
Dec 9, 2024
•
83
6
Você Vê, Você Consegue: Aprendizado de Criação 3D em Vídeos Livres de Pose em Escala
You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale
Baorui Ma, Huachen Gao, Haoge Deng, Zhengxiong Luo, Tiejun Huang, Lulu Tang, Xinlong Wang
•
Dec 9, 2024
•
13
3
Treinando Modelos de Linguagem Grandes para Raciocinar em um Espaço Latente Contínuo
Training Large Language Models to Reason in a Continuous Latent Space
Shibo Hao, Sainbayar Sukhbaatar, DiJia Su, Xian Li, Zhiting Hu, Jason Weston, Yuandong Tian
•
Dec 9, 2024
•
85
7
Incorporação Global e Densa da Terra: Major TOM Flutuando no Espaço Latente
Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space
Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
•
Dec 7, 2024
•
8
2
Ao Redor do Mundo em 80 Passos: Uma Abordagem Generativa para Geolocalização Visual Global
Around the World in 80 Timesteps: A Generative Approach to Global Visual Geolocation
Nicolas Dufour, David Picard, Vicky Kalogeiton, Loic Landrieu
•
Dec 9, 2024
•
21
2
Marca d'água de texto robusta de vários bits com parafraseadores baseados em LLM.
Robust Multi-bit Text Watermark with LLM-based Paraphrasers
Xiaojun Xu, Jinghan Jia, Yuanshun Yao, Yang Liu, Hang Li
•
Dec 4, 2024
•
6
2
Se não puder usá-los, recicle-os: Otimizando a Fusão em Escala para Mitigar Compromissos de Desempenho
If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs
Muhammad Khalifa, Yi-Chern Tan, Arash Ahmadian, Tom Hosking, Honglak Lee, Lu Wang, Ahmet Üstün, Tom Sherborne, Matthias Gallé
•
Dec 5, 2024
•
5
2
Explorando Anotações de Conceitos Multigranulares para Modelos de Linguagem Multimodais de Grande Escala
Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models
Xiao Xu, Tianhao Niu, Yuxi Xie, Libo Qin, Wanxiang Che, Min-Yen Kan
•
Dec 8, 2024
•
16
2
CARP: Aprendizagem de Política Visuomotora por meio de Predição Autoregressiva de Grossa a Fina
CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction
Zhefei Gong, Pengxiang Ding, Shangke Lyu, Siteng Huang, Mingyang Sun, Wei Zhao, Zhaoxin Fan, Donglin Wang
•
Dec 9, 2024
•
7
2
Maya: Um Modelo Multilíngue Multimodal Ajustado por Instruções
Maya: An Instruction Finetuned Multilingual Multimodal Model
Nahid Alam, Karthik Reddy Kanjula, Surya Guthikonda, Timothy Chung, Bala Krishna S Vegesna, Abhipsha Das, Anthony Susevski, Ryan Sze-Yin Chan, S M Iftekhar Uddin, Shayekh Bin Islam, Roshan Santhosh, Snegha A, Drishti Sharma, Chen Liu, Isha Chaturvedi, Genta Indra Winata, Ashvanth. S, Snehanshu Mukherjee, Alham Fikri Aji
•
Dec 10, 2024
•
29
2
MotionShop: Transferência de Movimento sem Uso de Exemplos em Modelos de Difusão de Vídeo com Mistura de Orientação de Pontuação
MotionShop: Zero-Shot Motion Transfer in Video Diffusion Models with Mixture of Score Guidance
Hidir Yesiltepe, Tuna Han Salih Meral, Connor Dunlop, Pinar Yanardag
•
Dec 6, 2024
•
9
2
Turbo3D: Geração Ultra-rápida de Texto para 3D
Turbo3D: Ultra-fast Text-to-3D Generation
Hanzhe Hu, Tianwei Yin, Fujun Luan, Yiwei Hu, Hao Tan, Zexiang Xu, Sai Bi, Shubham Tulsiani, Kai Zhang
•
Dec 5, 2024
•
4
2
Redes Delta com Portões: Melhorando o Mamba2 com a Regra Delta
Gated Delta Networks: Improving Mamba2 with Delta Rule
Songlin Yang, Jan Kautz, Ali Hatamizadeh
•
Dec 9, 2024
•
11
3