ChatPaper.ai
Apri menu
Home
Articoli del Giorno
arXiv
HuggingFace
Prezzi
Account
Spazio di lavoro
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
Articoli di Ricerca IA Giornalieri
Articoli di ricerca IA selezionati quotidianamente con traduzioni
February 7th, 2025
MotionLab: Generazione e Modifica Unificate del Movimento Umano tramite il Paradigma del Movimento-Condizione-Movimento
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm
Ziyan Guo, Zeyu Hu, Na Zhao, De Wen Soh
•
Feb 4, 2025
•
18
3
Apprendimento delle dinamiche dei video d'azione del mondo reale con l'autoregressione mascherata eterogenea
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression
Lirui Wang, Kevin Zhao, Chaoqi Liu, Xinlei Chen
•
Feb 6, 2025
•
6
3
Verso la comprensione fisica nella generazione di video: un approccio di regolarizzazione dei punti 3D
Towards Physical Understanding in Video Generation: A 3D Point Regularization Approach
Yunuo Chen, Junli Cao, Anil Kag, Vidit Goel, Sergei Korolev, Chenfanfu Jiang, Sergey Tulyakov, Jian Ren
•
Feb 5, 2025
•
9
3
PlotGen: Visualizzazione di dati scientifici basata su Multi-Agenti LLM tramite Feedback Multimodale
PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
6
2
Diffusione da Debole a Forte con Riflessione
Weak-to-Strong Diffusion with Reflection
Lichen Bai, Masashi Sugiyama, Zeke Xie
•
Feb 1, 2025
•
23
2
Ola: Spingendo i confini del modello linguistico omni-modale con l'allineamento progressivo della modalità
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
Zuyan Liu, Yuhao Dong, Jiahui Wang, Ziwei Liu, Winston Hu, Jiwen Lu, Yongming Rao
•
Feb 6, 2025
•
30
2
MotionCanvas: Progettazione di inquadrature cinematografiche con generazione immagine-video controllabile
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation
Jinbo Xing, Long Mai, Cusuh Ham, Jiahui Huang, Aniruddha Mahapatra, Chi-Wing Fu, Tien-Tsin Wong, Feng Liu
•
Feb 6, 2025
•
18
3
MAGA: Riformulazione Massiccia di Genere-Pubblico per l'Espansione del Corpus di Preallenamento
MAGA: MAssive Genre-Audience Reformulation to Pretraining Corpus Expansion
Xintong Hao, Ke Shen, Chenggang Li
•
Feb 6, 2025
•
22
2
Analisi del flusso delle caratteristiche per migliorare l'interpretazione e il controllo nei modelli linguistici.
Analyze Feature Flow to Enhance Interpretation and Steering in Language Models
Daniil Laptev, Nikita Balagansky, Yaroslav Aksenov, Daniil Gavrilov
•
Feb 5, 2025
•
60
2
Miglioramento della generazione di codice per lingue a bassa risorsa: Non esiste una soluzione miracolosa.
Enhancing Code Generation for Low-Resource Languages: No Silver Bullet
Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
•
Jan 31, 2025
•
5
2
ScoreFlow: Dominare i Flussi di Lavoro degli Agenti LLM tramite Ottimizzazione delle Preferenze basata su Punteggio
ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization
Yinjie Wang, Ling Yang, Guohao Li, Mengdi Wang, Bryon Aragam
•
Feb 6, 2025
•
19
2
ChartCitor: Framework Multi-Agente per l'Attribuzione Visiva Dettagliata dei Grafici
ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
7
2
UltraIF: Avanzamento dell'Instradamento delle Istruzioni dalla Natura
UltraIF: Advancing Instruction Following from the Wild
Kaikai An, Li Sheng, Ganqu Cui, Shuzheng Si, Ning Ding, Yu Cheng, Baobao Chang
•
Feb 6, 2025
•
23
2
DynVFX: Arricchire i Video Reali con Contenuti Dinamici
DynVFX: Augmenting Real Videos with Dynamic Content
Danah Yatim, Rafail Fridman, Omer Bar-Tal, Tali Dekel
•
Feb 5, 2025
•
30
3
Llasa: Scalare il calcolo del tempo di addestramento e del tempo di inferenza per la sintesi vocale basata su Llama
Llasa: Scaling Train-Time and Inference-Time Compute for Llama-based Speech Synthesis
Zhen Ye, Xinfa Zhu, Chi-Min Chan, Xinsheng Wang, Xu Tan, Jiahe Lei, Yi Peng, Haohe Liu, Yizhu Jin, Zheqi DAI, Hongzhan Lin, Jianyi Chen, Xingjian Du, Liumeng Xue, Yunlin Chen, Zhifei Li, Lei Xie, Qiuqiang Kong, Yike Guo, Wei Xue
•
Feb 6, 2025
•
25
4
Grandi modelli la pensano allo stesso modo e ciò mina la supervisione dell'IA.
Great Models Think Alike and this Undermines AI Oversight
Shashwat Goel, Joschka Struber, Ilze Amanda Auzina, Karuna K Chandra, Ponnurangam Kumaraguru, Douwe Kiela, Ameya Prabhu, Matthias Bethge, Jonas Geiping
•
Feb 6, 2025
•
34
2
ConceptAttention: i Transformer di Diffusione Apprendono Caratteristiche Altamente Interpretabili
ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features
Alec Helbling, Tuna Han Salih Meral, Ben Hoover, Pinar Yanardag, Duen Horng Chau
•
Feb 6, 2025
•
38
3
Prestazioni da medaglia d'oro nella risoluzione della geometria olimpica con AlphaGeometry2
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
•
Feb 5, 2025
•
44
5
Oltre ai Contenuti della Richiesta: Migliorare le Prestazioni di LLM tramite Ottimizzazione Integrata della Richiesta di Formato dei Contenuti
Beyond Prompt Content: Enhancing LLM Performance via Content-Format Integrated Prompt Optimization
Yuanye Liu, Jiahang Xu, Li Lyna Zhang, Qi Chen, Xuan Feng, Yang Chen, Zhongxin Guo, Yuqing Yang, Cheng Peng
•
Feb 6, 2025
•
13
2
Parla Facile: Elicitazione di Jailbreak Dannosi da LLMs con Interazioni Semplici
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions
Yik Siu Chan, Narutatsu Ri, Yuxin Xiao, Marzyeh Ghassemi
•
Feb 6, 2025
•
3
2
PILAF: Campionamento Ottimale delle Preferenze Umane per la Modellazione del Reward
PILAF: Optimal Human Preference Sampling for Reward Modeling
Yunzhen Feng, Ariel Kwiatkowski, Kunhao Zheng, Julia Kempe, Yaqi Duan
•
Feb 6, 2025
•
11
2
BOLT: Bootstrap di Lunghe Catene di Pensiero nei Modelli Linguistici senza Distillazione
BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation
Bo Pang, Hanze Dong, Jiacheng Xu, Silvio Savarese, Yingbo Zhou, Caiming Xiong
•
Feb 6, 2025
•
24
2