ChatPaper.ai
Menu openen
Home
Dagelijkse Papers
arXiv
HuggingFace
Prijzen
Account
Werkruimte
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
AI Onderzoekspapers Dagelijks
Dagelijks geselecteerde AI onderzoekspapers met vertalingen
March 4th, 2025
Phi-4-Mini Technisch Rapport: Compacte maar Krachtige Multimodale Taalmodellen via Mixture-of-LoRAs
Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs
Abdelrahman Abouelenin, Atabak Ashfaq, Adam Atkinson, Hany Awadalla, Nguyen Bach, Jianmin Bao, Alon Benhaim, Martin Cai, Vishrav Chaudhary, Congcong Chen, Dong Chen, Dongdong Chen, Junkun Chen, Weizhu Chen, Yen-Chun Chen, Yi-ling Chen, Qi Dai, Xiyang Dai, Ruchao Fan, Mei Gao, Min Gao, Amit Garg, Abhishek Goswami, Junheng Hao, Amr Hendy, Yuxuan Hu, Xin Jin, Mahmoud Khademi, Dongwoo Kim, Young Jin Kim, Gina Lee, Jinyu Li, Yunsheng Li, Chen Liang, Xihui Lin, Zeqi Lin, Mengchen Liu, Yang Liu, Gilsinia Lopez, Chong Luo, Piyush Madan, Vadim Mazalov, Ali Mousavi, Anh Nguyen, Jing Pan, Daniel Perez-Becker, Jacob Platin, Thomas Portet, Kai Qiu, Bo Ren, Liliang Ren, Sambuddha Roy, Ning Shang, Yelong Shen, Saksham Singhal, Subhojit Som, Xia Song, Tetyana Sych, Praneetha Vaddamanu, Shuohang Wang, Yiming Wang, Zhenghao Wang, Haibin Wu, Haoran Xu, Weijian Xu, Yifan Yang, Ziyi Yang, Donghan Yu, Ishmam Zabir, Jianwen Zhang, Li Lyna Zhang, Yunan Zhang, Xiren Zhou
•
Mar 3, 2025
•
87
6
Visual-RFT: Visuele Versterkingsfijnafstemming
Visual-RFT: Visual Reinforcement Fine-Tuning
Ziyu Liu, Zeyi Sun, Yuhang Zang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi Wang
•
Mar 3, 2025
•
78
2
Difix3D+: Verbetering van 3D-reconstructies met enkelstaps diffusiemodellen
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models
Jay Zhangjie Wu, Yuxuan Zhang, Haithem Turki, Xuanchi Ren, Jun Gao, Mike Zheng Shou, Sanja Fidler, Zan Gojcic, Huan Ling
•
Mar 3, 2025
•
44
2
Cognitieve Gedragingen die Zelfverbeterende Redeneerders Mogelijk Maken, ofwel, Vier Gewoonten van Zeer Effectieve STaRs
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs
Kanishk Gandhi, Ayush Chakravarthy, Anikait Singh, Nathan Lile, Noah D. Goodman
•
Mar 3, 2025
•
38
3
Van uren naar minuten: Verliesvrije versnelling van ultra-lange sequentiegeneratie tot 100K tokens
From Hours to Minutes: Lossless Acceleration of Ultra Long Sequence Generation up to 100K Tokens
Tong Wu, Junzhe Shen, Zixia Jia, Yuxuan Wang, Zilong Zheng
•
Feb 26, 2025
•
30
2
DiffRhythm: Razendsnel en verbazingwekkend eenvoudig end-to-end genereren van volledige liedjes met latente diffusie
DiffRhythm: Blazingly Fast and Embarrassingly Simple End-to-End Full-Length Song Generation with Latent Diffusion
Ziqian Ning, Huakang Chen, Yuepeng Jiang, Chunbo Hao, Guobin Ma, Shuai Wang, Jixun Yao, Lei Xie
•
Mar 3, 2025
•
27
2
OneRec: Het verenigen van ophalen en rangschikken met een generatieve aanbevelingssysteem en iteratieve voorkeursafstemming
OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment
Jiaxin Deng, Shiyao Wang, Kuo Cai, Lejian Ren, Qigen Hu, Weifeng Ding, Qiang Luo, Guorui Zhou
•
Feb 26, 2025
•
25
2
Wanneer een LLM terughoudend is over zijn antwoorden -- en wanneer zijn onzekerheid gerechtvaardigd is
When an LLM is apprehensive about its answers -- and when its uncertainty is justified
Petr Sychev, Andrey Goncharov, Daniil Vyazhev, Edvard Khalafyan, Alexey Zaytsev
•
Mar 3, 2025
•
21
2
Liger: Linearisatie van Grote Taalmodellen naar Gegateerde Recursieve Structuren
Liger: Linearizing Large Language Models to Gated Recurrent Structures
Disen Lan, Weigao Sun, Jiaxi Hu, Jusen Du, Yu Cheng
•
Mar 3, 2025
•
18
2
Kiss3DGen: Hergebruik van beelddiffusiemodellen voor 3D-assetgeneratie
Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation
Jiantao Lin, Xin Yang, Meixi Chen, Yingjie Xu, Dongyu Yan, Leyi Wu, Xinli Xu, Lie XU, Shunsi Zhang, Ying-Cong Chen
•
Mar 3, 2025
•
15
2
Efficiënte schaling tijdens testen via zelfkalibratie
Efficient Test-Time Scaling via Self-Calibration
Chengsong Huang, Langlin Huang, Jixuan Leng, Jiacheng Liu, Jiaxin Huang
•
Feb 25, 2025
•
15
2
DuoDecoding: Hardwarebewuste heterogene speculatieve decodering met dynamische multi-sequentie conceptvorming
DuoDecoding: Hardware-aware Heterogeneous Speculative Decoding with Dynamic Multi-Sequence Drafting
Kai Lv, Honglin Guo, Qipeng Guo, Xipeng Qiu
•
Mar 2, 2025
•
13
2
Speculatieve Ad-hoc Querying
Speculative Ad-hoc Querying
Haoyu Li, Srikanth Kandula, Maria Angels de Luis Balaguer, Aditya Akella, Venkat Arun
•
Mar 2, 2025
•
13
2
Grootschalige Dataselectie voor Instructieafstemming
Large-Scale Data Selection for Instruction Tuning
Hamish Ivison, Muru Zhang, Faeze Brahman, Pang Wei Koh, Pradeep Dasigi
•
Mar 3, 2025
•
12
2
Qilin: Een multimodaal informatie-ophalingsdataset met app-niveau gebruikerssessies
Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions
Jia Chen, Qian Dong, Haitao Li, Xiaohui He, Yan Gao, Shaosheng Cao, Yi Wu, Ping Yang, Chen Xu, Yao Hu, Qingyao Ai, Yiqun Liu
•
Mar 1, 2025
•
12
2
SampleMix: Een strategie voor het mengen van pre-trainingsgegevens op monsterniveau door de kwaliteit en diversiteit van gegevens te coördineren
SampleMix: A Sample-wise Pre-training Data Mixing Strategey by Coordinating Data Quality and Diversity
Xiangyu Xi, Deyang Kong, Jian Yang, Jiawei Yang, Zhengyu Chen, Wei Wang, Jingang Wang, Xunliang Cai, Shikun Zhang, Wei Ye
•
Mar 3, 2025
•
9
2
VideoUFO: Een Miljoen-Schaal Gebruikersgericht Dataset voor Tekst-naar-Video Generatie
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation
Wenhao Wang, Yi Yang
•
Mar 3, 2025
•
8
2
CodeArena: Een collectief evaluatieplatform voor codegeneratie door grote taalmodellen
CodeArena: A Collective Evaluation Platform for LLM Code Generation
Mingzhe Du, Anh Tuan Luu, Bin Ji, Xiaobao Wu, Dong Huang, Terry Yue Zhuo, Qian Liu, See-Kiong Ng
•
Mar 3, 2025
•
8
2
PodAgent: Een Uitgebreid Framework voor Podcastgeneratie
PodAgent: A Comprehensive Framework for Podcast Generation
Yujia Xiao, Lei He, Haohan Guo, Fenglong Xie, Tan Lee
•
Mar 1, 2025
•
6
2
Woordvorm doet ertoe: Semantische reconstructie van LLM's onder typoglykemie
Word Form Matters: LLMs' Semantic Reconstruction under Typoglycemia
Chenxi Wang, Tianle Gu, Zhongyu Wei, Lang Gao, Zirui Song, Xiuying Chen
•
Mar 3, 2025
•
5
2
Door AI Uitgevonden Tonale Talen: Het Voorkomen van een Machine Lingua Franca die het Menselijk Begrip Overstijgt
AI-Invented Tonal Languages: Preventing a Machine Lingua Franca Beyond Human Understanding
David Noever
•
Mar 2, 2025
•
5
2
Algemeen redeneren vereist vanaf het begin leren redeneren.
General Reasoning Requires Learning to Reason from the Get-go
Seungwook Han, Jyothish Pari, Samuel J. Gershman, Pulkit Agrawal
•
Feb 26, 2025
•
5
2
Het aanleren van metrische afstand aan autoregressieve multimodale fundamentele modellen
Teaching Metric Distance to Autoregressive Multimodal Foundational Models
Jiwan Chung, Saejin Kim, Yongrae Jo, Jaewoo Park, Dongjun Min, Youngjae Yu
•
Mar 4, 2025
•
4
2
Direct Discriminatieve Optimalisatie: Je Waarschijnlijkheidsgebaseerde Visuele Generatieve Model is Stiekem een GAN Discriminator
Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator
Kaiwen Zheng, Yongxin Chen, Huayu Chen, Guande He, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang
•
Mar 3, 2025
•
4
2
CLEA: Gesloten-lus Belichaamde Agent voor het Verbeteren van Taakuitvoering in Dynamische Omgevingen
CLEA: Closed-Loop Embodied Agent for Enhancing Task Execution in Dynamic Environments
Mingcong Lei, Ge Wang, Yiming Zhao, Zhixin Mai, Qing Zhao, Yao Guo, Zhen Li, Shuguang Cui, Yatong Han, Jinke Ren
•
Mar 2, 2025
•
3
2
Waarom zijn web-AI-agenten kwetsbaarder dan standalone LLM's? Een beveiligingsanalyse
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis
Jeffrey Yang Fan Chiang, Seungjae Lee, Jia-Bin Huang, Furong Huang, Yizheng Chen
•
Feb 27, 2025
•
3
2
Reconstructie van kamerindeling vanuit ongeposeerde, schaarse beelden in het tijdperk van voorgetrainde modellen
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model
Yaxuan Huang, Xili Dai, Jianan Wang, Xianbiao Qi, Yixing Yuan, Xiangyu Yue
•
Feb 24, 2025
•
3
2
RSQ: Leren van belangrijke tokens leidt tot betere gekwantiseerde LLM's
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs
Yi-Lin Sung, Prateek Yadav, Jialu Li, Jaehong Yoon, Mohit Bansal
•
Mar 3, 2025
•
2
3