ChatPaper.ai
Apri menu
Home
Articoli del Giorno
arXiv
HuggingFace
Prezzi
Account
Spazio di lavoro
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Articoli di Ricerca IA Giornalieri
Articoli di ricerca IA selezionati quotidianamente con traduzioni
February 25th, 2025
Analisi dell'Impatto dei Metodi di Quantizzazione sulla Sicurezza e Affidabilità dei Modelli Linguistici di Grandi Dimensioni
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models
Artyom Kharinaev, Viktor Moskvoretskii, Egor Shvetsov, Kseniia Studenikina, Bykov Mikhail, Evgeny Burnaev
•
Feb 18, 2025
•
7
2
Pianificazione Riflessiva: Modelli Visione-Linguaggio per la Manipolazione Robotica a Lungo Termine a Multi-Stadio
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation
Yunhai Feng, Jiaming Han, Zhuoran Yang, Xiangyu Yue, Sergey Levine, Jianlan Luo
•
Feb 23, 2025
•
13
2
VideoGrain: Modulazione dell'attenzione spazio-temporale per l'editing video multi-granulare
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing
Xiangpeng Yang, Linchao Zhu, Hehe Fan, Yi Yang
•
Feb 24, 2025
•
79
5
Stable-SPAM: Come Addestrare in 4-Bit con Maggiore Stabilità rispetto a Adam in 16-Bit
Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam
Tianjin Huang, Haotian Hu, Zhenyu Zhang, Gaojie Jin, Xiang Li, Li Shen, Tianlong Chen, Lu Liu, Qingsong Wen, Zhangyang Wang, Shiwei Liu
•
Feb 24, 2025
•
18
2
Rendiamo di nuovo grande LoRA: Potenziamento di LoRA con valori singolari adattivi e allineamento ottimizzato tramite miscela di esperti
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment
Chenghao Fan, Zhenyi Lu, Sichen Liu, Xiaoye Qu, Wei Wei, Chengfeng Gu, Yu Cheng
•
Feb 24, 2025
•
29
4
Mobile-Agent-V: Apprendimento delle Operazioni su Dispositivi Mobili Attraverso la Collaborazione Multi-Agente Guidata da Video
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration
Junyang Wang, Haiyang Xu, Xi Zhang, Ming Yan, Ji Zhang, Fei Huang, Jitao Sang
•
Feb 24, 2025
•
13
2
X-Dancer: Generazione di Video di Danza Umana da Musica Espressiva
X-Dancer: Expressive Music to Human Dance Video Generation
Zeyuan Chen, Hongyi Xu, Guoxian Song, You Xie, Chenxu Zhang, Xin Chen, Chao Wang, Di Chang, Linjie Luo
•
Feb 24, 2025
•
11
3
InductionBench: I LLM falliscono nella classe di complessità più semplice
InductionBench: LLMs Fail in the Simplest Complexity Class
Wenyue Hua, Tyler Wong, Sun Fei, Liangming Pan, Adam Jardine, William Yang Wang
•
Feb 20, 2025
•
7
2
Generalizzabilità Linguistica del Ridimensionamento al Momento del Test nel Ragionamento Matematico
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
Guijin Son, Jiwoo Hong, Hyunwoo Ko, James Thorne
•
Feb 24, 2025
•
26
2
MutaGReP: Ricerca di Piani Basata su Repository Senza Esecuzione per l'Uso del Codice
MutaGReP: Execution-Free Repository-Grounded Plan Search for Code-Use
Zaid Khan, Ali Farhadi, Ranjay Krishna, Luca Weihs, Mohit Bansal, Tanmay Gupta
•
Feb 21, 2025
•
5
2
Slamming: Addestramento di un Modello Linguistico per il Parlato su una Singola GPU in un Giorno
Slamming: Training a Speech Language Model on One GPU in a Day
Gallil Maimon, Avishai Elmakies, Yossi Adi
•
Feb 19, 2025
•
69
2
MONSTER: Repository Monash per la Valutazione Scalabile di Serie Temporali
MONSTER: Monash Scalable Time Series Evaluation Repository
Angus Dempster, Navid Mohammadi Foumani, Chang Wei Tan, Lynn Miller, Amish Mishra, Mahsa Salehi, Charlotte Pelletier, Daniel F. Schmidt, Geoffrey I. Webb
•
Feb 21, 2025
•
3
2
Valutazione del Ragionamento Temporale e dell'Allineamento Attraverso le Dinastie Cinesi
Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties
Zhenglin Wang, Jialong Wu, Pengfei LI, Yong Jiang, Deyu Zhou
•
Feb 24, 2025
•
8
4
Attenzione al Divario! Valutazioni Statiche e Interattive dei Modelli Audio di Grande Scala
Mind the Gap! Static and Interactive Evaluations of Large Audio Models
Minzhi Li, William Barr Held, Michael J Ryan, Kunat Pipatanakul, Potsawee Manakul, Hao Zhu, Diyi Yang
•
Feb 21, 2025
•
4
2
Oltre il Rilascio: Considerazioni sull'Accesso per i Sistemi di Intelligenza Artificiale Generativa
Beyond Release: Access Considerations for Generative AI Systems
Irene Solaiman, Rishi Bommasani, Dan Hendrycks, Ariel Herbert-Voss, Yacine Jernite, Aviya Skowron, Andrew Trask
•
Feb 23, 2025
•
16
4
Il serpente nella sfera browniana
The snake in the Brownian sphere
Omer Angel, Emmanuel Jacob, Brett Kolesnik, Grégory Miermont
•
Feb 18, 2025
•
2
2
TAG: Un Framework Decentralizzato per l'Apprendimento per Rinforzo Gerarchico Multi-Agente
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning
Giuseppe Paolo, Abdelhakim Benechehab, Hamza Cherkaoui, Albert Thomas, Balázs Kégl
•
Feb 21, 2025
•
9
2
CodeCriticBench: Un Benchmark Olistico per la Valutazione del Codice nei Modelli Linguistici di Grandi Dimensioni
CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models
Alexander Zhang, Marcus Dong, Jiaheng Liu, Wei Zhang, Yejie Wang, Jian Yang, Ge Zhang, Tianyu Liu, Zhongyuan Peng, Yingshui Tan, Yuanxing Zhang, Zhexu Wang, Weixun Wang, Yancheng He, Ken Deng, Wangchunshu Zhou, Wenhao Huang, Zhaoxiang Zhang
•
Feb 23, 2025
•
27
3
Pandora3D: Un Framework Completo per la Generazione di Forme 3D e Texture di Alta Qualità
Pandora3D: A Comprehensive Framework for High-Quality 3D Shape and Texture Generation
Jiayu Yang, Taizhang Shang, Weixuan Sun, Xibin Song, Ziang Cheng, Senbo Wang, Shenzhou Chen, Weizhe Liu, Hongdong Li, Pan Ji
•
Feb 20, 2025
•
6
2
DICEPTION: Un Modello di Diffusione Generalista per Compiti di Percezione Visiva
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks
Canyu Zhao, Mingyu Liu, Huanyi Zheng, Muzhi Zhu, Zhiyue Zhao, Hao Chen, Tong He, Chunhua Shen
•
Feb 24, 2025
•
53
3
Stima della Qualità della Traduzione con Early-Exit e Confidenza Istantanea
Early-Exit and Instant Confidence Translation Quality Estimation
Vilém Zouhar, Maike Züfle, Beni Egressy, Julius Cheng, Jan Niehues
•
Feb 20, 2025
•
4
2
MegaLoc: Un Unico Sistema di Recupero per Collocarli Tutti
MegaLoc: One Retrieval to Place Them All
Gabriele Berton, Carlo Masone
•
Feb 24, 2025
•
3
2
Diagnosi della Gravità del COVID-19 da Immagini Radiografiche Toraciche Utilizzando Architetture ViT e CNN
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures
Luis Lara, Lucia Eve Berger, Rajesh Raju, Shawn Whitfield
•
Feb 23, 2025
•
2
2
Ragionamento sull'Incoerenza Multimodale (MMIR): Un Nuovo Benchmark per Modelli di Ragionamento Multimodale
Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models
Qianqi Yan, Yue Fan, Hongquan Li, Shan Jiang, Yang Zhao, Xinze Guan, Ching-Chen Kuo, Xin Eric Wang
•
Feb 22, 2025
•
18
2
Previsione della Crescita dei Modelli AI Open-Weight su Hugging Face
Forecasting Open-Weight AI Model Growth on Hugging Face
Kushal Raj Bhandari, Pin-Yu Chen, Jianxi Gao
•
Feb 21, 2025
•
10
3
L'extrapolazione della lunghezza è una sfida fondamentale per i modelli di diffusione video, poiché richiede la generazione coerente di frame aggiuntivi oltre la lunghezza di addestramento. Presentiamo RIFLEx, un approccio innovativo che sfrutta le proprietà intrinseche dei trasformatori per estendere la lunghezza dei video generati senza necessità di riaddestramento. RIFLEx introduce un meccanismo di riflessione che consente al modello di riutilizzare efficacemente le informazioni apprese durante l'addestramento, garantendo coerenza temporale e qualità visiva nei frame estesi. Sperimentazioni estensive dimostrano che RIFLEx supera i metodi esistenti in termini di qualità percepita e coerenza temporale, offrendo una soluzione praticabile per l'estensione della lunghezza dei video in scenari reali.
RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers
Min Zhao, Guande He, Yixiao Chen, Hongzhou Zhu, Chongxuan Li, Jun Zhu
•
Feb 21, 2025
•
20
3
GCC: Costanza del Colore Generativa tramite Diffusione di una Tavola dei Colori
GCC: Generative Color Constancy via Diffusing a Color Checker
Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
•
Feb 24, 2025
•
28
2
Audio-FLAN: Una Versione Preliminare
Audio-FLAN: A Preliminary Release
Liumeng Xue, Ziya Zhou, Jiahao Pan, Zixuan Li, Shuai Fan, Yinghao Ma, Sitong Cheng, Dongchao Yang, Haohan Guo, Yujia Xiao, Xinsheng Wang, Zixuan Shen, Chuanbo Zhu, Xinshen Zhang, Tianchi Liu, Ruibin Yuan, Zeyue Tian, Haohe Liu, Emmanouil Benetos, Ge Zhang, Yike Guo, Wei Xue
•
Feb 23, 2025
•
37
2
Comprensione Autodidatta Agente di Contesti Lunghi
Self-Taught Agentic Long Context Understanding
Yufan Zhuang, Xiaodong Yu, Jialian Wu, Ximeng Sun, Ze Wang, Jiang Liu, Yusheng Su, Jingbo Shang, Zicheng Liu, Emad Barsoum
•
Feb 21, 2025
•
3
2
M3-AGIQA: Valutazione della Qualità delle Immagini Generate da AI Multimodale, Multi-Round, Multi-Aspect
M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment
Chuan Cui, Kejiang Chen, Zhihua Wei, Wen Shen, Weiming Zhang, Nenghai Yu
•
Feb 21, 2025
•
2
2
Così Parlò il Modello Linguistico di Grande Contesto
Thus Spake Long-Context Large Language Model
Xiaoran Liu, Ruixiao Li, Mianqiu Huang, Zhigeng Liu, Yuerong Song, Qipeng Guo, Siyang He, Qiqi Wang, Linlin Li, Qun Liu, Yaqian Zhou, Xuanjing Huang, Xipeng Qiu
•
Feb 24, 2025
•
73
6
Generazione di Linguaggio Persuasivo Contestualizzato per il Marketing Automatizzato
Grounded Persuasive Language Generation for Automated Marketing
Jibang Wu, Chenghao Yang, Simon Mahns, Chaoqi Wang, Hao Zhu, Fei Fang, Haifeng Xu
•
Feb 24, 2025
•
12
3
Le Community Notes Possono Sostituire i Fact-Checker Professionisti?
Can Community Notes Replace Professional Fact-Checkers?
Nadav Borenstein, Greta Warren, Desmond Elliott, Isabelle Augenstein
•
Feb 19, 2025
•
6
2