ChatPaper.aiChatPaper.ai
Home

arXiv

HuggingFace

PrezziAccountSpazio di lavoro

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articoli di Ricerca IA Giornalieri

Articoli di ricerca IA selezionati quotidianamente con traduzioni

ReCamMaster: Rendering Generativo Controllato dalla Fotocamera da un Singolo Video
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Jianhong Bai, Menghan Xia, Xiao Fu, Xintao Wang, Lianrui Mu, Jinwen Cao, Zuozhu Liu, Haoji Hu, Xiang Bai, Pengfei Wan, Di Zhang•Mar 14, 2025•1415

SmolDocling: Un modello visione-linguaggio ultra-compatto per la conversione multimodale end-to-end di documenti
SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion

Ahmed Nassar, Andres Marafioti, Matteo Omenetti, Maksym Lysak, Nikolaos Livathinos, Christoph Auer, Lucas Morin, Rafael Teixeira de Lima, Yusik Kim, A. Said Gurbuz, Michele Dolfi, Miquel Farré, Peter W. J. Staar•Mar 14, 2025•10816

PLADIS: Superare i Limiti dell'Attenzione nei Modelli di Diffusione al Momento dell'Inferenza Sfruttando la Sparsità
PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity

Kwanyoung Kim, Byeongsu Sim•Mar 10, 2025•862

Agenti API vs. Agenti GUI: Divergenze e Convergenze
API Agents vs. GUI Agents: Divergence and Convergence

Chaoyun Zhang, Shilin He, Liqun Li, Si Qin, Yu Kang, Qingwei Lin, Dongmei Zhang•Mar 14, 2025•373

Raccolta di Dati Adversariali: Perturbazioni Collaborative Umane per un Apprendimento Imitativo Robotic Efficace e Robusto
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning

Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren•Mar 14, 2025•362

Tecnologie su Efficacia ed Efficienza: Un'Analisi dei Modelli a Spazi di Stato
Technologies on Effectiveness and Efficiency: A Survey of State Spaces Models

Xingtai Lv, Youbang Sun, Kaiyan Zhang, Shang Qu, Xuekai Zhu, Yuchen Fan, Yi Wu, Ermo Hua, Xinwei Long, Ning Ding, Bowen Zhou•Mar 14, 2025•272

VGGT: Trasformatore con Base nella Geometria Visiva
VGGT: Visual Geometry Grounded Transformer

Jianyuan Wang, Minghao Chen, Nikita Karaev, Andrea Vedaldi, Christian Rupprecht, David Novotny•Mar 14, 2025•212

Vamba: Comprendere video della durata di un'ora con Mamba-Transformer ibridi
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers

Weiming Ren, Wentao Ma, Huan Yang, Cong Wei, Ge Zhang, Wenhu Chen•Mar 14, 2025•202

FlowTok: Scorrimento fluido tra token di testo e immagini
FlowTok: Flowing Seamlessly Across Text and Image Tokens

Ju He, Qihang Yu, Qihao Liu, Liang-Chieh Chen•Mar 13, 2025•192

Esplorare le Vulnerabilità del Federated Learning: Un'Analisi Approfondita sugli Attacchi di Inversione del Gradiente
Exploring the Vulnerabilities of Federated Learning: A Deep Dive into Gradient Inversion Attacks

Pengxin Guo, Runxi Wang, Shuang Zeng, Jinjing Zhu, Haoning Jiang, Yanran Wang, Yuyin Zhou, Feifei Wang, Hui Xiong, Liangqiong Qu•Mar 13, 2025•182

TxAgent: Un Agente IA per il Ragionamento Terapeutico Attraverso un Universo di Strumenti
TxAgent: An AI Agent for Therapeutic Reasoning Across a Universe of Tools

Shanghua Gao, Richard Zhu, Zhenglun Kong, Ayush Noori, Xiaorui Su, Curtis Ginder, Theodoros Tsiligkaridis, Marinka Zitnik•Mar 14, 2025•173

Pre-addestramento su larga scala per la generazione di didascalie video contestualizzate
Large-scale Pre-training for Grounded Video Caption Generation

Evangelos Kazakos, Cordelia Schmid, Josef Sivic•Mar 13, 2025•162

Attenzione di Kolmogorov-Arnold: L'attenzione apprendibile è migliore per i Vision Transformer?
Kolmogorov-Arnold Attention: Is Learnable Attention Better For Vision Transformers?

Subhajit Maity, Killian Hitsman, Xin Li, Aritra Dutta•Mar 13, 2025•142

ETCH: Generalizzazione dell'adattamento corporeo agli esseri umani vestiti tramite aderenza equivariante
ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness

Boqian Li, Haiwen Feng, Zeyu Cai, Michael J. Black, Yuliang Xiu•Mar 13, 2025•102

Modellazione Autoregressiva Vicinale per la Generazione Visiva Efficiente
Neighboring Autoregressive Modeling for Efficient Visual Generation

Yefei He, Yuanyu He, Shaoxuan He, Feng Chen, Hong Zhou, Kaipeng Zhang, Bohan Zhuang•Mar 12, 2025•83

ProJudge: Un Benchmark Multimodale e Multidisciplinare e un Dataset di Instruction-Tuning per Giudici di Processo Basati su MLLM
ProJudge: A Multi-Modal Multi-Discipline Benchmark and Instruction-Tuning Dataset for MLLM-based Process Judges

Jiaxin Ai, Pengfei Zhou, Zhaopan Xu, Ming Li, Fanrui Zhang, Zizhen Li, Jianwen Sun, Yukang Feng, Baojin Huang, Zhongyuan Wang, Kaipeng Zhang•Mar 9, 2025•82

ARMOR v0.1: Potenziamento del Modello di Comprensione Multimodale Autoregressivo con Generazione Multimodale Intervallata tramite Sinergia Asimmetrica
ARMOR v0.1: Empowering Autoregressive Multimodal Understanding Model with Interleaved Multimodal Generation via Asymmetric Synergy

Jianwen Sun, Yukang Feng, Chuanhao Li, Fanrui Zhang, Zizhen Li, Jiaxin Ai, Sizhuo Zhou, Yu Dai, Shenglin Zhang, Kaipeng Zhang•Mar 9, 2025•82

Da TOWER a SPIRE: Aggiungere la modalità vocale a un LLM esclusivamente testuale
From TOWER to SPIRE: Adding the Speech Modality to a Text-Only LLM

Kshitij Ambilduke, Ben Peters, Sonal Sannigrahi, Anil Keshwani, Tsz Kin Lam, Bruno Martins, Marcely Zanon Boito, André F. T. Martins•Mar 13, 2025•72

MaRI: Integrazione del Recupero di Materiali tra Domini
MaRI: Material Retrieval Integration across Domains

Jianhui Wang, Zhifei Yang, Yangfan He, Huixiong Zhang, Yuxuan Chen, Jingwei Huang•Mar 11, 2025•72

Apprendimento di Modelli di Diffusione a Pochi Passi mediante Allineamento della Distribuzione delle Traiettorie
Learning Few-Step Diffusion Models by Trajectory Distribution Matching

Yihong Luo, Tianyang Hu, Jiacheng Sun, Yujun Cai, Jing Tang•Mar 9, 2025•73

TreeMeshGPT: Generazione Artistica di Mesh con Sequenziamento Autoregressivo ad Albero
TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing

Stefan Lionar, Jiabin Liang, Gim Hee Lee•Mar 14, 2025•62

I modelli di ragionamento su larga scala sono in grado di eseguire ragionamento analogico in condizioni di incertezza percettiva?
Can Large Reasoning Models do Analogical Reasoning under Perceptual Uncertainty?

Giacomo Camposampiero, Michael Hersche, Roger Wattenhofer, Abu Sebastian, Abbas Rahimi•Mar 14, 2025•52

Cockatiel: Integrazione di Addestramento Sintetico e Preferenze Umane per la Generazione di Descrizioni Video Dettagliate
Cockatiel: Ensembling Synthetic and Human Preferenced Training for Detailed Video Caption

Luozheng Qin, Zhiyu Tan, Mengping Yang, Xiaomeng Yang, Hao Li•Mar 12, 2025•52

Scoperta di Abilità in Mondi Aperti da Dimostrazioni Non Segmentate
Open-World Skill Discovery from Unsegmented Demonstrations

Jingwen Deng, Zihao Wang, Shaofei Cai, Anji Liu, Yitao Liang•Mar 11, 2025•53

CHOrD: Generazione di Gemelli Digitali Organizzati, Scala Abitativa e Privi di Collisioni per Scene Indoor 3D con Piante Controllabili e Layout Ottimali
CHOrD: Generation of Collision-Free, House-Scale, and Organized Digital Twins for 3D Indoor Scenes with Controllable Floor Plans and Optimal Layouts

Chong Su, Yingbin Fu, Zheyuan Hu, Jing Yang, Param Hanji, Shaojun Wang, Xuan Zhao, Cengiz Öztireli, Fangcheng Zhong•Mar 15, 2025•34

GoalFlow: Modellazione del Flusso Guidato da Obiettivi per la Generazione di Traiettorie Multimodali nella Guida Autonoma End-to-End
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving

Zebin Xing, Xingyu Zhang, Yang Hu, Bo Jiang, Tong He, Qian Zhang, Xiaoxiao Long, Wei Yin•Mar 7, 2025•32

Apprendimento automatico robusto ai gruppi per la cancellazione dei dati
Group-robust Machine Unlearning

Thomas De Min, Subhankar Roy, Stéphane Lathuilière, Elisa Ricci, Massimiliano Mancini•Mar 12, 2025•12