ChatPaper.aiChatPaper.ai
Home

arXiv

HuggingFace

PrezziAccountSpazio di lavoro

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Articoli di Ricerca IA Giornalieri

Articoli di ricerca IA selezionati quotidianamente con traduzioni

RWKV-7 "Goose" con Evoluzione Dinamica Espressiva dello Stato
RWKV-7 "Goose" with Expressive Dynamic State Evolution

Bo Peng, Ruichong Zhang, Daniel Goldstein, Eric Alcaide, Haowen Hou, Janna Lu, William Merrill, Guangyu Song, Kaifeng Tan, Saiteja Utpala, Nathan Wilce, Johan S. Wind, Tianyi Wu, Daniel Wuttke, Christian Zhou-Zheng•Mar 18, 2025•14911

DAPO: Un Sistema Open-Source di Apprendimento per Rinforzo su LLM su Larga Scala
DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Qiying Yu, Zheng Zhang, Ruofei Zhu, Yufeng Yuan, Xiaochen Zuo, Yu Yue, Tiantian Fan, Gaohong Liu, Lingjun Liu, Xin Liu, Haibin Lin, Zhiqi Lin, Bole Ma, Guangming Sheng, Yuxuan Tong, Chi Zhang, Mofan Zhang, Wang Zhang, Hang Zhu, Jinhua Zhu, Jiaze Chen, Jiangjie Chen, Chengyi Wang, Hongli Yu, Weinan Dai, Yuxuan Song, Xiangpeng Wei, Hao Zhou, Jingjing Liu, Wei-Ying Ma, Ya-Qin Zhang, Lin Yan, Mu Qiao, Yonghui Wu, Mingxuan Wang•Mar 18, 2025•1285

Video Impossibili
Impossible Videos

Zechen Bai, Hai Ci, Mike Zheng Shou•Mar 18, 2025•622

Creation-MMBench: Valutazione dell'Intelligenza Creativa Contestuale nei MLLM
Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLM

Xinyu Fang, Zhijian Chen, Kai Lan, Shengyuan Ding, Yingji Liang, Xiangyu Zhao, Farong Wen, Zicheng Zhang, Guofeng Zhang, Haodong Duan, Kai Chen, Dahua Lin•Mar 18, 2025•482

Mobilità Infinita: Sintesi Scalabile ad Alta Fedeltà di Oggetti Articolati tramite Generazione Procedurale
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation

Xinyu Lian, Zichao Yu, Ruiming Liang, Yitong Wang, Li Ray Luo, Kaixu Chen, Yuanzhen Zhou, Qihong Tang, Xudong Xu, Zhaoyang Lyu, Bo Dai, Jiangmiao Pang•Mar 17, 2025•302

DeepPerception: Avanzamento della percezione visiva cognitiva di tipo R1 nei MLLM per il grounding visivo ad alta intensità di conoscenza
DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding

Xinyu Ma, Ziyang Ding, Zhicong Luo, Chi Chen, Zonghao Guo, Derek F. Wong, Xiaoyi Feng, Maosong Sun•Mar 17, 2025•302

AudioX: Trasformatore a Diffusione per la Generazione da Qualsiasi Input ad Audio
AudioX: Diffusion Transformer for Anything-to-Audio Generation

Zeyue Tian, Yizhu Jin, Zhaoyang Liu, Ruibin Yuan, Xu Tan, Qifeng Chen, Wei Xue, Yike Guo•Mar 13, 2025•263

Allineamento di Modelli Linguistici Multimodali alle Preferenze Umane: Una Rassegna
Aligning Multimodal LLM with Human Preference: A Survey

Tao Yu, Yi-Fan Zhang, Chaoyou Fu, Junkang Wu, Jinda Lu, Kun Wang, Xingyu Lu, Yunhang Shen, Guibin Zhang, Dingjie Song, Yibo Yan, Tianlong Xu, Qingsong Wen, Zhang Zhang, Yan Huang, Liang Wang, Tieniu Tan•Mar 18, 2025•253

CapArena: Benchmark e analisi della descrizione dettagliata di immagini nell'era dei modelli linguistici di grandi dimensioni
CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era

Kanzhi Cheng, Wenpo Song, Jiaxin Fan, Zheng Ma, Qiushi Sun, Fangzhi Xu, Chenyang Yan, Nuo Chen, Jianbing Zhang, Jiajun Chen•Mar 16, 2025•252

Frac-Connections: Estensione Frazionaria delle Iper-Connessioni
Frac-Connections: Fractional Extension of Hyper-Connections

Defa Zhu, Hongzhi Huang, Jundong Zhou, Zihao Huang, Yutao Zeng, Banggu Wu, Qiyang Min, Xun Zhou•Mar 18, 2025•214

Cosmos-Transfer1: Generazione Condizionata di Mondi con Controllo Adattivo Multimodale
Cosmos-Transfer1: Conditional World Generation with Adaptive Multimodal Control

NVIDIA, Hassan Abu Alhaija, Jose Alvarez, Maciej Bala, Tiffany Cai, Tianshi Cao, Liz Cha, Joshua Chen, Mike Chen, Francesco Ferroni, Sanja Fidler, Dieter Fox, Yunhao Ge, Jinwei Gu, Ali Hassani, Michael Isaev, Pooya Jannaty, Shiyi Lan, Tobias Lasser, Huan Ling, Ming-Yu Liu, Xian Liu, Yifan Lu, Alice Luo, Qianli Ma, Hanzi Mao, Fabio Ramos, Xuanchi Ren, Tianchang Shen, Shitao Tang, Ting-Chun Wang, Jay Wu, Jiashu Xu, Stella Xu, Kevin Xie, Yuchong Ye, Xiaodong Yang, Xiaohui Zeng, Yu Zeng•Mar 18, 2025•182

FlexWorld: Espansione Progressiva di Scene 3D per la Sintesi Flessibile della Vista
FlexWorld: Progressively Expanding 3D Scenes for Flexiable-View Synthesis

Luxi Chen, Zihan Zhou, Min Zhao, Yikai Wang, Ge Zhang, Wenhao Huang, Hao Sun, Ji-Rong Wen, Chongxuan Li•Mar 17, 2025•152

Atlas: L'attenzione multi-scala migliora la modellazione di immagini con contesto esteso
Atlas: Multi-Scale Attention Improves Long Context Image Modeling

Kumar Krishna Agrawal, Long Lian, Longchao Liu, Natalia Harguindeguy, Boyi Li, Alexander Bick, Maggie Chung, Trevor Darrell, Adam Yala•Mar 16, 2025•122

Misurare la capacità dell'IA di completare attività complesse
Measuring AI Ability to Complete Long Tasks

Thomas Kwa, Ben West, Joel Becker, Amy Deng, Katharyn Garcia, Max Hasin, Sami Jawhar, Megan Kinniment, Nate Rush, Sydney Von Arx, Ryan Bloom, Thomas Broadley, Haoxing Du, Brian Goodrich, Nikola Jurkovic, Luke Harold Miles, Seraphina Nix, Tao Lin, Neev Parikh, David Rein, Lucas Jun Koba Sato, Hjalmar Wijk, Daniel M. Ziegler, Elizabeth Barnes, Lawrence Chan•Mar 18, 2025•112

Coerenza Temporale per l'Identificazione degli Errori nel Processo di Ragionamento dei Modelli Linguistici di Grande Dimensione
Temporal Consistency for LLM Reasoning Process Error Identification

Jiacheng Guo, Yue Wu, Jiahao Qiu, Kaixuan Huang, Xinzhe Juan, Ling Yang, Mengdi Wang•Mar 18, 2025•102

Concat-ID: Verso una Sintesi Video Universale che Preserva l'Identità
Concat-ID: Towards Universal Identity-Preserving Video Synthesis

Yong Zhong, Zhuoyi Yang, Jiayan Teng, Xiaotao Gu, Chongxuan Li•Mar 18, 2025•102

MPBench: Un Benchmark Completo per il Ragionamento Multimodale nell'Identificazione degli Errori di Processo
MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

Zhaopan Xu, Pengfei Zhou, Jiaxin Ai, Wangbo Zhao, Kai Wang, Xiaojiang Peng, Wenqi Shao, Hongxun Yao, Kaipeng Zhang•Mar 16, 2025•92

Reflect-DiT: Scalabilità al Tempo di Inferenza per Modelli di Diffusione Testo-Immagine tramite Riflessione In-Contesto
Reflect-DiT: Inference-Time Scaling for Text-to-Image Diffusion Transformers via In-Context Reflection

Shufan Li, Konstantinos Kallidromitis, Akash Gokul, Arsh Koneru, Yusuke Kato, Kazuki Kozuka, Aditya Grover•Mar 15, 2025•92

MM-Spatial: Esplorazione della comprensione spaziale 3D nei modelli linguistici multimodali
MM-Spatial: Exploring 3D Spatial Understanding in Multimodal LLMs

Erik Daxberger, Nina Wenzel, David Griffiths, Haiming Gang, Justin Lazarow, Gefen Kohavi, Kai Kang, Marcin Eichner, Yinfei Yang, Afshin Dehghan, Peter Grasch•Mar 17, 2025•74

Verso una Cognizione Sistematica Auto-Migliorante per le Prossime Generazioni di Modelli Linguistici Multimodali di Base
Towards Self-Improving Systematic Cognition for Next-Generation Foundation MLLMs

Xiaoying Zhang, Da Peng, Yipeng Zhang, Zonghao Guo, Chengyue Wu, Chi Chen, Wei Ke, Helen Meng, Maosong Sun•Mar 16, 2025•73

Florenz: Leggi di scala per la generalizzazione sistematica nei modelli visione-linguaggio
Florenz: Scaling Laws for Systematic Generalization in Vision-Language Models

Julian Spravil, Sebastian Houben, Sven Behnke•Mar 12, 2025•72

Pensate: Meno Dati, Miglior Ragionamento -- Ripensare i Modelli Linguistici Francesi
Pensez: Less Data, Better Reasoning -- Rethinking French LLM

Huy Hoang Ha•Mar 17, 2025•52

PEBench: Un Dataset Fittizio per Valutare il Machine Unlearning nei Modelli Linguistici Multimodali di Grandi Dimensioni
PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

Zhaopan Xu, Pengfei Zhou, Weidong Tang, Jiaxin Ai, Wangbo Zhao, Xiaojiang Peng, Kai Wang, Yang You, Wenqi Shao, Hongxun Yao, Kaipeng Zhang•Mar 16, 2025•52

EvalTree: Profilare le Debolezze dei Modelli Linguistici tramite Alberi Gerarchici di Capacità
EvalTree: Profiling Language Model Weaknesses via Hierarchical Capability Trees

Zhiyuan Zeng, Yizhong Wang, Hannaneh Hajishirzi, Pang Wei Koh•Mar 11, 2025•52

Apprendimento dell'inferenza adattiva per modelli linguistici multimodali di grandi dimensioni
Learning to Inference Adaptively for Multimodal Large Language Models

Zhuoyan Xu, Khoi Duc Nguyen, Preeti Mukherjee, Saurabh Bagchi, Somali Chaterji, Yingyu Liang, Yin Li•Mar 13, 2025•42

PyGDA: Una Libreria Python per l'Adattamento di Dominio su Grafi
PyGDA: A Python Library for Graph Domain Adaptation

Zhen Zhang, Meihan Liu, Bingsheng He•Mar 13, 2025•42

MeshFleet: Dataset 3D Filtrato e Annotato di Veicoli per la Modellazione Generativa Specifica al Dominio
MeshFleet: Filtered and Annotated 3D Vehicle Dataset for Domain Specific Generative Modeling

Damian Boborzi, Phillip Mueller, Jonas Emrich, Dominik Schmid, Sebastian Mueller, Lars Mikelsons•Mar 18, 2025•32

Modelli Visione-Linguaggio con Consapevolezza della Sicurezza in Spazio Iperbolico
Hyperbolic Safety-Aware Vision-Language Models

Tobia Poppi, Tejaswi Kasarla, Pascal Mettes, Lorenzo Baraldi, Rita Cucchiara•Mar 15, 2025•32

KUDA: Punti chiave per unificare l'apprendimento dinamico e il prompting visivo per la manipolazione robotica a vocabolario aperto
KUDA: Keypoints to Unify Dynamics Learning and Visual Prompting for Open-Vocabulary Robotic Manipulation

Zixian Liu, Mingtong Zhang, Yunzhu Li•Mar 13, 2025•32

RoCo-Sim: Miglioramento della percezione collaborativa stradale attraverso la simulazione in primo piano
RoCo-Sim: Enhancing Roadside Collaborative Perception through Foreground Simulation

Yuwen Du, Anning Hu, Zichen Chao, Yifan Lu, Junhao Ge, Genjia Liu, Weitao Wu, Lanjun Wang, Siheng Chen•Mar 13, 2025•32

CoLMDriver: La negoziazione basata su LLM favorisce la guida autonoma cooperativa
CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving

Changxing Liu, Genjia Liu, Zijun Wang, Jinchang Yang, Siheng Chen•Mar 11, 2025•12