ChatPaper.ai
Menu openen
Home
Dagelijkse Papers
arXiv
HuggingFace
Prijzen
Account
Werkruimte
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
AI Onderzoekspapers Dagelijks
Dagelijks geselecteerde AI onderzoekspapers met vertalingen
January 3rd, 2025
MLLM-als-rechter voor beeldveiligheid zonder menselijke labeling
MLLM-as-a-Judge for Image Safety without Human Labeling
Zhenting Wang, Shuming Hu, Shiyu Zhao, Xiaowen Lin, Felix Juefei-Xu, Zhuowei Li, Ligong Han, Harihar Subramanyam, Li Chen, Jianfa Chen, Nan Jiang, Lingjuan Lyu, Shiqing Ma, Dimitris N. Metaxas, Ankit Jain
•
Dec 31, 2024
•
31
2
SeFAR: Semi-begeleide fijnmazige actieherkenning met tijdelijke verstoring en leerstabilisatie
SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization
Yongle Huang, Haodong Chen, Zhenbang Xu, Zihan Jia, Haozhou Sun, Dian Shao
•
Jan 2, 2025
•
5
2
CodeElo: Benchmarking van het genereren van code op competitieniveau van LLM's met Elo-beoordelingen vergelijkbaar met mensen.
CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings
Shanghaoran Quan, Jiaxi Yang, Bowen Yu, Bo Zheng, Dayiheng Liu, An Yang, Xuancheng Ren, Bofei Gao, Yibo Miao, Yunlong Feng, Zekun Wang, Jian Yang, Zeyu Cui, Yang Fan, Yichang Zhang, Binyuan Hui, Junyang Lin
•
Jan 2, 2025
•
53
6
A3: Android Agent Arena voor Mobiele GUI-agenten
A3: Android Agent Arena for Mobile GUI Agents
Yuxiang Chai, Hanhao Li, Jiayu Zhang, Liang Liu, Guozhi Wang, Shuai Ren, Siyuan Huang, Hongsheng Li
•
Jan 2, 2025
•
22
3
Het begrijpen en verminderen van knelpunten van toestandsruimtemodellen door de lens van recentheid en overgladstrijken.
Understanding and Mitigating Bottlenecks of State Space Models through the Lens of Recency and Over-smoothing
Peihao Wang, Ruisi Cai, Yuehao Wang, Jiajun Zhu, Pragya Srivastava, Zhangyang Wang, Pan Li
•
Dec 31, 2024
•
7
2
VideoRefer Suite: Vooruitgang in ruimtelijk-temporele objectherkenning met Video LLM
VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM
Yuqian Yuan, Hang Zhang, Wentong Li, Zesen Cheng, Boqiang Zhang, Long Li, Xin Li, Deli Zhao, Wenqiao Zhang, Yueting Zhuang, Jianke Zhu, Lidong Bing
•
Dec 31, 2024
•
48
2
Reconstructie versus Generatie: Het Temmen van het Optimalisatie Dilemma in Latente Diffusie Modellen
Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models
Jingfeng Yao, Xinggang Wang
•
Jan 2, 2025
•
43
2
2,5 Jaar in de Klas: Een Multimodaal Leerboek voor Visie-Taal Voorafgaande Training
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining
Wenqi Zhang, Hang Zhang, Xin Li, Jiashuo Sun, Yongliang Shen, Weiming Lu, Deli Zhao, Yueting Zhuang, Lidong Bing
•
Jan 1, 2025
•
107
7
ProgCo: Programma Helpt Bij Zelfcorrectie van Grote Taalmodellen
ProgCo: Program Helps Self-Correction of Large Language Models
Xiaoshuai Song, Yanan Wu, Weixun Wang, Jiaheng Liu, Wenbo Su, Bo Zheng
•
Jan 2, 2025
•
27
2
MapQaTor: Een systeem voor efficiënte annotatie van kaartquery-datasets
MapQaTor: A System for Efficient Annotation of Map Query Datasets
Mahir Labib Dihan, Mohammed Eunus Ali, Md Rizwan Parvez
•
Dec 30, 2024
•
10
2
Dynamische Schaling van Unit Tests voor Code Reward Modellering
Dynamic Scaling of Unit Tests for Code Reward Modeling
Zeyao Ma, Xiaokang Zhang, Jing Zhang, Jifan Yu, Sijia Luo, Jie Tang
•
Jan 2, 2025
•
17
2
Geneste Aandacht: Semantisch-bewuste Aandachtswaarden voor Conceptpersonalisatie
Nested Attention: Semantic-aware Attention Values for Concept Personalization
Or Patashnik, Rinon Gal, Daniil Ostashev, Sergey Tulyakov, Kfir Aberman, Daniel Cohen-Or
•
Jan 2, 2025
•
11
2
VideoAnydoor: Video-objectinvoeging met hoge nauwkeurigheid en precieze bewegingsbesturing
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control
Yuanpeng Tu, Hao Luo, Xi Chen, Sihui Ji, Xiang Bai, Hengshuang Zhao
•
Jan 2, 2025
•
55
3
SeedVR: Het zaaien van oneindigheid in de Diffusion Transformer voor Generieke Videoherstelling.
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration
Jianyi Wang, Zhijie Lin, Meng Wei, Yang Zhao, Ceyuan Yang, Chen Change Loy, Lu Jiang
•
Jan 2, 2025
•
11
2
Populatiebewuste diffusie voor het genereren van tijdreeksen
Population Aware Diffusion for Time Series Generation
Yang Li, Han Meng, Zhenyu Bi, Ingolv T. Urnes, Haipeng Chen
•
Jan 1, 2025
•
6
2
MapEval: Een op kaarten gebaseerde evaluatie van geo-ruimtelijk redeneren in fundamentele modellen
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models
Mahir Labib Dihan, Md Tanvir Hassan, Md Tanvir Parvez, Md Hasebul Hasan, Md Almash Alam, Muhammad Aamir Cheema, Mohammed Eunus Ali, Md Rizwan Parvez
•
Dec 31, 2024
•
22
2
Het verenigen van gespecialiseerde visuele encoders voor video-taalmodellen
Unifying Specialized Visual Encoders for Video Language Models
Jihoon Chung, Tyler Zhu, Max Gonzalez Saez-Diez, Juan Carlos Niebles, Honglu Zhou, Olga Russakovsky
•
Jan 2, 2025
•
21
2
LTX-Video: Realtime Video Latente Diffusie
LTX-Video: Realtime Video Latent Diffusion
Yoav HaCohen, Nisan Chiprut, Benny Brazowski, Daniel Shalem, Dudu Moshe, Eitan Richardson, Eran Levin, Guy Shiran, Nir Zabari, Ori Gordon, Poriya Panet, Sapir Weissbuch, Victor Kulikov, Yaki Bitterman, Zeev Melumian, Ofir Bibi
•
Dec 30, 2024
•
47
3
Heroverweging van Adressering in Taalmodellen via Gecontextualiseerde Equivalentie-Positionele Codering
Rethinking Addressing in Language Models via Contexualized Equivariant Positional Encoding
Jiajun Zhu, Peihao Wang, Ruisi Cai, Jason D. Lee, Pan Li, Zhangyang Wang
•
Jan 1, 2025
•
6
4