ChatPaper.ai
Menu openen
Home
Dagelijkse Papers
arXiv
HuggingFace
Prijzen
Account
Werkruimte
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
AI Onderzoekspapers Dagelijks
Dagelijks geselecteerde AI onderzoekspapers met vertalingen
January 7th, 2025
STAR: Ruimtelijk-Temporale Augmentatie met Tekst-naar-Video Modellen voor Superresolutie van Video's in de Echte Wereld
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Rui Xie, Yinhong Liu, Penghao Zhou, Chen Zhao, Jun Zhou, Kai Zhang, Zhenyu Zhang, Jian Yang, Zhenheng Yang, Ying Tai
•
Jan 6, 2025
•
56
3
Testtijdcomputing: van Systeem-1 denken naar Systeem-2 denken
Test-time Computing: from System-1 Thinking to System-2 Thinking
Yixin Ji, Juntao Li, Hai Ye, Kaixin Wu, Jia Xu, Linjian Mo, Min Zhang
•
Jan 5, 2025
•
46
2
BoostStep: Het verbeteren van de wiskundige capaciteit van Grote Taalmodellen via verbeterde redenering in één stap.
BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning
Beichen Zhang, Yuhong Liu, Xiaoyi Dong, Yuhang Zang, Pan Zhang, Haodong Duan, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
45
2
Dispider: Het mogelijk maken van Video LLM's met Actieve Real-Time Interactie via Ontwarde Perceptie, Beslissing en Reactie
Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction
Rui Qian, Shuangrui Ding, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
37
5
Gepersonaliseerde Grafiekgebaseerde Terugvinding voor Grote Taalmodellen
Personalized Graph-Based Retrieval for Large Language Models
Steven Au, Cameron J. Dimacali, Ojasmitha Pedirappagari, Namyong Park, Franck Dernoncourt, Yu Wang, Nikos Kanakaris, Hanieh Deilamsalehy, Ryan A. Rossi, Nesreen K. Ahmed
•
Jan 4, 2025
•
32
2
TransPixar: Vooruitgang in Tekst-naar-Video Generatie met Transparantie
TransPixar: Advancing Text-to-Video Generation with Transparency
Luozhou Wang, Yijun Li, Zhifei Chen, Jui-Hsien Wang, Zhifei Zhang, He Zhang, Zhe Lin, Yingcong Chen
•
Jan 6, 2025
•
27
4
Schalingswetten voor training met zwevendekommagetallenquantisering
Scaling Laws for Floating Point Quantization Training
Xingwu Sun, Shuaipeng Li, Ruobing Xie, Weidong Han, Kan Wu, Zhen Yang, Yixing Li, An Wang, Shuai Li, Jinbao Xue, Yu Cheng, Yangyu Tao, Zhanhui Kang, Chengzhong Xu, Di Wang, Jie Jiang
•
Jan 5, 2025
•
27
2
Through-The-Mask: Maskergebaseerde Bewegingstrajecten voor Beeld-naar-Video Generatie
Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation
Guy Yariv, Yuval Kirstain, Amit Zohar, Shelly Sheynin, Yaniv Taigman, Yossi Adi, Sagie Benaim, Adam Polyak
•
Jan 6, 2025
•
22
2
METAGENE-1: Metagenomisch fundamentmodel voor pandemiebewaking
METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring
Ollie Liu, Sami Jaghouar, Johannes Hagemann, Shangshang Wang, Jason Wiemels, Jeff Kaufman, Willie Neiswanger
•
Jan 3, 2025
•
21
2
Auto-RT: Automatische Gevangenisbreukstrategie Verkenning voor Rode Teamtests met Grote Taalmodellen
Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models
Yanjiang Liu, Shuhen Zhou, Yaojie Lu, Huijia Zhu, Weiqiang Wang, Hongyu Lin, Ben He, Xianpei Han, Le Sun
•
Jan 3, 2025
•
18
2
GS-DiT: Vooruitgang in Video Generatie met Pseudo 4D Gaussische Velden door Efficiënte Dichte 3D Punt Tracking
GS-DiT: Advancing Video Generation with Pseudo 4D Gaussian Fields through Efficient Dense 3D Point Tracking
Weikang Bian, Zhaoyang Huang, Xiaoyu Shi, Yijin Li, Fu-Yun Wang, Hongsheng Li
•
Jan 5, 2025
•
17
3
DepthMaster: Het temmen van diffusiemodellen voor monoculair diepteschatting.
DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
Ziyang Song, Zerong Wang, Bo Li, Hao Zhang, Ruijie Zhu, Li Liu, Peng-Tao Jiang, Tianzhu Zhang
•
Jan 5, 2025
•
15
4
PRMBench: Een fijnmazige en uitdagende benchmark voor beloningsmodellen op procesniveau
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
Mingyang Song, Zhaochen Su, Xiaoye Qu, Jiawei Zhou, Yu Cheng
•
Jan 6, 2025
•
14
2
ToolHop: Een op vragen gebaseerde benchmark voor het evalueren van grote taalmodellen bij het gebruik van meerdere stappen.
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use
Junjie Ye, Zhengyin Du, Xuesong Yao, Weijian Lin, Yufei Xu, Zehui Chen, Zaiyuan Wang, Sining Zhu, Zhiheng Xi, Siyu Yuan, Tao Gui, Qi Zhang, Xuanjing Huang, Jiechao Chen
•
Jan 5, 2025
•
11
3
Samba-asr geavanceerde spraakherkenning die gebruikmaakt van gestructureerde toestandsruimtemodellen
Samba-asr state-of-the-art speech recognition leveraging structured state-space models
Syed Abdul Gaffar Shakhadri, Kruthika KR, Kartik Basavaraj Angadi
•
Jan 6, 2025
•
9
3
Ingrediënten: Het combineren van aangepaste foto's met videodiffusietransformatoren.
Ingredients: Blending Custom Photos with Video Diffusion Transformers
Zhengcong Fei, Debang Li, Di Qiu, Changqian Yu, Mingyuan Fan
•
Jan 3, 2025
•
8
2
AutoPresent: Het ontwerpen van gestructureerde visuals vanaf nul
AutoPresent: Designing Structured Visuals from Scratch
Jiaxin Ge, Zora Zhiruo Wang, Xuhui Zhou, Yi-Hao Peng, Sanjay Subramanian, Qinyue Tan, Maarten Sap, Alane Suhr, Daniel Fried, Graham Neubig, Trevor Darrell
•
Jan 1, 2025
•
8
2
Geautomatiseerde Generatie van Uitdagende Meerkeuzevragen voor de Evaluatie van Visie-Taalmodel
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
Yuhui Zhang, Yuchang Su, Yiming Liu, Xiaohan Wang, James Burgess, Elaine Sui, Chenyu Wang, Josiah Aklilu, Alejandro Lozano, Anjiang Wei, Ludwig Schmidt, Serena Yeung-Levy
•
Jan 6, 2025
•
7
2
ProTracker: Probabilistische Integratie voor Robuuste en Nauwkeurige Punttracking
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking
Tingyang Zhang, Chen Wang, Zhiyang Dou, Qingzhe Gao, Jiahui Lei, Baoquan Chen, Lingjie Liu
•
Jan 6, 2025
•
4
2