ChatPaper.ai
Apri menu
Home
Articoli del Giorno
arXiv
HuggingFace
Prezzi
Account
Spazio di lavoro
🇮🇹
Italiano
Loading...
•
•
•
•
•
•
•
•
•
•
Articoli di Ricerca IA Giornalieri
Articoli di ricerca IA selezionati quotidianamente con traduzioni
October 23rd, 2024
PyramidDrop: Accelerare i Tuoi Grandi Modelli Visione-Linguaggio tramite Riduzione della Redondanza Visiva a Piramide
PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction
Long Xing, Qidong Huang, Xiaoyi Dong, Jiajie Lu, Pan Zhang, Yuhang Zang, Yuhang Cao, Conghui He, Jiaqi Wang, Feng Wu, Dahua Lin
•
Oct 22, 2024
•
48
2
SpectroMotion: Ricostruzione dinamica in 3D di scene speculari
SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes
Cheng-De Fan, Chen-Wei Chang, Yi-Ruei Liu, Jie-Ying Lee, Jiun-Long Huang, Yu-Chee Tseng, Yu-Lun Liu
•
Oct 22, 2024
•
43
2
Migliorare il Modello Linguistico di Visione per il Ragionamento a Catena del Pensiero.
Improve Vision Language Model Chain-of-thought Reasoning
Ruohong Zhang, Bowen Zhang, Yanghao Li, Haotian Zhang, Zhiqing Sun, Zhe Gan, Yinfei Yang, Ruoming Pang, Yiming Yang
•
Oct 21, 2024
•
27
2
Allineare i Grandi Modelli Linguistici tramite Ottimizzazione Auto-Diretta
Aligning Large Language Models via Self-Steering Optimization
Hao Xiang, Bowen Yu, Hongyu Lin, Keming Lu, Yaojie Lu, Xianpei Han, Le Sun, Jingren Zhou, Junyang Lin
•
Oct 22, 2024
•
23
3
xGen-MM-Vid (BLIP-3-Video): Ti servono solo 32 token per rappresentare un video anche nei VLM
xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs
Michael S. Ryoo, Honglu Zhou, Shrikant Kendre, Can Qin, Le Xue, Manli Shu, Silvio Savarese, Ran Xu, Caiming Xiong, Juan Carlos Niebles
•
Oct 21, 2024
•
18
2
Mitigazione dell'allucinazione degli oggetti tramite attenzione causale concentrica
Mitigating Object Hallucination via Concentric Causal Attention
Yun Xing, Yiheng Li, Ivan Laptev, Shijian Lu
•
Oct 21, 2024
•
17
2
MiniPLM: Distillazione della Conoscenza per il Pre-Addestramento dei Modelli Linguistici
MiniPLM: Knowledge Distillation for Pre-Training Language Models
Yuxian Gu, Hao Zhou, Fandong Meng, Jie Zhou, Minlie Huang
•
Oct 22, 2024
•
16
2
JMMMU: un benchmark giapponese di comprensione multimodale e multi-disciplinare su larga scala per valutazioni consapevoli della cultura.
JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding Benchmark for Culture-aware Evaluation
Shota Onohara, Atsuyuki Miyai, Yuki Imajuku, Kazuki Egashira, Jeonghun Baek, Xiang Yue, Graham Neubig, Kiyoharu Aizawa
•
Oct 22, 2024
•
15
2
Ottimizzazione basata su LLM dei Sistemi AI Compositi: Un'Indagine
LLM-based Optimization of Compound AI Systems: A Survey
Matthieu Lin, Jenny Sheng, Andrew Zhao, Shenzhi Wang, Yang Yue, Yiran Wu, Huan Liu, Jun Liu, Gao Huang, Yong-Jin Liu
•
Oct 21, 2024
•
15
2
EvoPress: Verso una Compressione Ottimale dei Modelli Dinamici tramite Ricerca Evolutiva
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search
Oliver Sieberling, Denis Kuznedelev, Eldar Kurtic, Dan Alistarh
•
Oct 18, 2024
•
9
2
Neurochirurgia Matematica: Isolare le Capacità di Ragionamento Matematico dei Modelli Linguistici Utilizzando Solo Passaggi in Avanti
Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities Using Only Forward Passes
Bryan R. Christ, Zack Gottesman, Jonathan Kropko, Thomas Hartvigsen
•
Oct 22, 2024
•
8
2
3DGS-Enhancer: Potenziare lo Splatting Gaussiano 3D Illimitato con Priori di Diffusione 2D Coerenti con la Vista
3DGS-Enhancer: Enhancing Unbounded 3D Gaussian Splatting with View-consistent 2D Diffusion Priors
Xi Liu, Chaoyi Zhou, Siyu Huang
•
Oct 21, 2024
•
5
2
Frontiere nella Colonscopia Intelligente
Frontiers in Intelligent Colonoscopy
Ge-Peng Ji, Jingyi Liu, Peng Xu, Nick Barnes, Fahad Shahbaz Khan, Salman Khan, Deng-Ping Fan
•
Oct 22, 2024
•
4
2