ChatPaper.aiChatPaper.ai
Home

arXiv

HuggingFace

PrezziAccountSpazio di lavoro

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articoli di Ricerca IA Giornalieri

Articoli di ricerca IA selezionati quotidianamente con traduzioni

Quando Meno è Sufficiente: Riduzione Adattiva dei Token per una Rappresentazione Efficiente delle Immagini
When Less is Enough: Adaptive Token Reduction for Efficient Image Representation

Eduard Allakhverdov, Elizaveta Goncharova, Andrey Kuznetsov•Mar 20, 2025•732

MAPS: Un Framework Multi-Agente Basato sulla Personalità Big Seven e sulla Guida Socratica per la Risoluzione Multimodale di Problemi Scientifici
MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientific Problem Solving

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, Xinyu Zhang, Fangzhi Xu, Qika Lin, Rui Mao, Erik Cambria, Jun Liu•Mar 21, 2025•542

Un'Esauriente Rassegna sulla Modellazione Linguistica a Lungo Contesto
A Comprehensive Survey on Long Context Language Modeling

Jiaheng Liu, Dawei Zhu, Zhiqi Bai, Yancheng He, Huanxuan Liao, Haoran Que, Zekun Wang, Chenchen Zhang, Ge Zhang, Jiebin Zhang, Yuanxing Zhang, Zhuo Chen, Hangyu Guo, Shilong Li, Ziqiang Liu, Yong Shan, Yifan Song, Jiayi Tian, Wenhao Wu, Zhejian Zhou, Ruijie Zhu, Junlan Feng, Yang Gao, Shizhu He, Zhoujun Li, Tianyu Liu, Fanyu Meng, Wenbo Su, Yingshui Tan, Zili Wang, Jian Yang, Wei Ye, Bo Zheng, Wangchunshu Zhou, Wenhao Huang, Sujian Li, Zhaoxiang Zhang•Mar 20, 2025•492

MARS: Un Framework Multi-Agente che Incorpora la Guida Socratica per l'Ottimizzazione Automatica dei Prompt
MARS: A Multi-Agent Framework Incorporating Socratic Guidance for Automated Prompt Optimization

Jian Zhang, Zhangqi Wang, Haiping Zhu, Jun Liu, Qika Lin, Erik Cambria•Mar 21, 2025•442

RoboFactory: Esplorazione della Collaborazione tra Agenti Embodied con Vincoli Composizionali
RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints

Yiran Qin, Li Kang, Xiufeng Song, Zhenfei Yin, Xiaohong Liu, Xihui Liu, Ruimao Zhang, Lei Bai•Mar 20, 2025•402

Modifica Post-Addestramento di Modelli Linguistici di Grandi Dimensioni per la Scrittura Creativa Diversificata
Modifying Large Language Model Post-Training for Diverse Creative Writing

John Joon Young Chung, Vishakh Padmakumar, Melissa Roemmele, Yuqian Sun, Max Kreminski•Mar 21, 2025•363

Collegare token continui e discreti per la generazione visiva autoregressiva
Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation

Yuqing Wang, Zhijie Lin, Yao Teng, Yuanzhi Zhu, Shuhuai Ren, Jiashi Feng, Xihui Liu•Mar 20, 2025•354

TaoAvatar: Avatar Full-Body Realistici in Tempo Reale per la Realtà Aumentata tramite 3D Gaussian Splatting
TaoAvatar: Real-Time Lifelike Full-Body Talking Avatars for Augmented Reality via 3D Gaussian Splatting

Jianchuan Chen, Jingchuan Hu, Gaige Wang, Zhonghua Jiang, Tiansong Zhou, Zhiwen Chen, Chengfei Lv•Mar 21, 2025•263

OpenVLThinker: Un'esplorazione iniziale del ragionamento complesso visione-linguaggio attraverso il miglioramento iterativo autonomo
OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement

Yihe Deng, Hritik Bansal, Fan Yin, Nanyun Peng, Wei Wang, Kai-Wei Chang•Mar 21, 2025•232

Abilitare controlli versatili per i modelli di diffusione video
Enabling Versatile Controls for Video Diffusion Models

Xu Zhang, Hao Zhou, Haoming Qin, Xiaobin Lu, Jiaxing Yan, Guanzhong Wang, Zeyu Chen, Yi Liu•Mar 21, 2025•152

MathFlow: Migliorare il Flusso Percettivo dei MLLM per Problemi Matematici Visivi
MathFlow: Enhancing the Perceptual Flow of MLLMs for Visual Mathematical Problems

Felix Chen, Hangjie Yuan, Yunqiu Xu, Tao Feng, Jun Cen, Pengwei Liu, Zeying Huang, Yi Yang•Mar 19, 2025•153

Generazione e Modifica Iterativa Guidata dal Soggetto su Singola Immagine
Single Image Iterative Subject-driven Generation and Editing

Yair Shpitzer, Gal Chechik, Idan Schwartz•Mar 20, 2025•142

ETVA: Valutazione dell'Allineamento Testo-Video tramite Generazione e Risposta di Domande a Grana Fine
ETVA: Evaluation of Text-to-Video Alignment via Fine-grained Question Generation and Answering

Kaisi Guan, Zhengfeng Lai, Yuchong Sun, Peng Zhang, Wei Liu, Kieran Liu, Meng Cao, Ruihua Song•Mar 21, 2025•112

FastCuRL: Apprendimento per Rinforzo con Curriculum ed Estensione Progressiva del Contesto per un Addestramento Efficiente di Modelli di Ragionamento Simili a R1
FastCuRL: Curriculum Reinforcement Learning with Progressive Context Extension for Efficient Training R1-like Reasoning Models

Mingyang Song, Mao Zheng, Zheng Li, Wenjie Yang, Xuan Luo, Yue Pan, Feng Zhang•Mar 21, 2025•103

I grandi modelli linguistici visivi possono leggere le mappe come un essere umano?
Can Large Vision Language Models Read Maps Like a Human?

Shuo Xing, Zezhou Sun, Shuangyu Xie, Kaiyuan Chen, Yanjia Huang, Yuping Wang, Jiachen Li, Dezhen Song, Zhengzhong Tu•Mar 18, 2025•92

Dalla Testa alla Coda: Verso una Rappresentazione Bilanciata nei Modelli di Visione e Linguaggio su Grande Scala attraverso la Calibrazione Adattiva dei Dati
From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration

Mingyang Song, Xiaoye Qu, Jiawei Zhou, Yu Cheng•Mar 17, 2025•92

PVChat: Chat Video Personalizzato con Apprendimento One-Shot
PVChat: Personalized Video Chat with One-Shot Learning

Yufei Shi, Weilong Yan, Gang Xu, Yumeng Li, Yuchen Li, Zhenxi Li, Fei Richard Yu, Ming Li, Si Yong Yeo•Mar 21, 2025•72

Modelli di ragionamento con schemi simili a bias impliciti
Implicit Bias-Like Patterns in Reasoning Models

Messi H. J. Lee, Calvin K. Lai•Mar 14, 2025•72

Quando le Preferenze Divergono: Allineare i Modelli di Diffusione con DPO Adattivo Consapevole delle Minoranze
When Preferences Diverge: Aligning Diffusion Models with Minority-Aware Adaptive DPO

Lingfan Zhang, Chen Liu, Chengming Xu, Kai Hu, Donghao Luo, Chengjie Wang, Yanwei Fu, Yuan Yao•Mar 21, 2025•62

GAEA: Un Modello Conversazionale Consapevole della Geolocalizzazione
GAEA: A Geolocation Aware Conversational Model

Ron Campos, Ashmal Vayani, Parth Parag Kulkarni, Rohit Gupta, Aritra Dutta, Mubarak Shah•Mar 20, 2025•62

FFaceNeRF: Modifica del volto con pochi esempi nei campi di radianza neurale
FFaceNeRF: Few-shot Face Editing in Neural Radiance Fields

Kwan Yun, Chaelin Kim, Hangyeul Shin, Junyong Noh•Mar 21, 2025•52

Segmentazione Generalizzata di Nuvole di Punti 3D con Modelli Visione-Linguaggio in Condizioni di Scarsità di Dati
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

Zhaochong An, Guolei Sun, Yun Liu, Runjia Li, Junlin Han, Ender Konukoglu, Serge Belongie•Mar 20, 2025•52