ChatPaper.ai
Menu openen
Home
Dagelijkse Papers
arXiv
HuggingFace
Prijzen
Account
Werkruimte
🇬🇧
English
Loading...
•
•
•
•
•
•
•
•
•
•
AI Onderzoekspapers Dagelijks
Dagelijks geselecteerde AI onderzoekspapers met vertalingen
February 6th, 2025
HackerRank-ASTRA: Evaluatie van de juistheid en consistentie van grote taalmodellen bij cross-domain multi-file project problemen
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems
Jun Xing, Mayur Bhatia, Sahil Phulwani, Darshan Suresh, Rafik Matta
•
Jan 31, 2025
•
0
2
LayerTracer: Cognitief-uitgelijnde gelaagde SVG-synthese via Diffusion Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
Yiren Song, Danze Chen, Mike Zheng Shou
•
Feb 3, 2025
•
20
4
Raadsel me dit! Sluwe lidmaatschapsinferentie voor opvraging-versterkte generatie
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation
Ali Naseh, Yuefeng Peng, Anshuman Suri, Harsh Chaudhari, Alina Oprea, Amir Houmansadr
•
Feb 1, 2025
•
5
2
TwinMarket: Een Schaalbare Gedrags- en Sociale Simulatie voor Financiële Markten
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets
Yuzhe Yang, Yifei Zhang, Minghao Wu, Kaidi Zhang, Yunmiao Zhang, Honghai Yu, Yan Hu, Benyou Wang
•
Feb 3, 2025
•
38
3
Versterking van multimodale redenering met MCTS-geautomatiseerd gestructureerd denken
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking
Jinyang Wu, Mingkuan Feng, Shuai Zhang, Ruihan Jin, Feihu Che, Zengqi Wen, Jianhua Tao
•
Feb 4, 2025
•
22
4
Zelfbegeleide foutopsporing bij het genereren van code met behulp van een groot taalmodel.
Large Language Model Guided Self-Debugging Code Generation
Muntasir Adnan, Zhiwei Xu, Carlos C. N. Kuhn
•
Feb 5, 2025
•
13
2
Het ontrafelen van langdurig redeneren in LLM's
Demystifying Long Chain-of-Thought Reasoning in LLMs
Edward Yeo, Yuxuan Tong, Morry Niu, Graham Neubig, Xiang Yue
•
Feb 5, 2025
•
59
3
Over het hacken van docenten bij het destilleren van taalmodel.
On Teacher Hacking in Language Model Distillation
Daniil Tiapkin, Daniele Calandriello, Johan Ferret, Sarah Perrin, Nino Vieillard, Alexandre Ramé, Mathieu Blondel
•
Feb 4, 2025
•
18
2
Een Probabilistische Inferentiebenadering voor Schaalvergroting van LLMs tijdens Inferentie met behulp van Deeltjesgebaseerde Monte Carlo Methoden
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods
Isha Puri, Shivchander Sudalairaj, Guangxuan Xu, Kai Xu, Akash Srivastava
•
Feb 3, 2025
•
10
3
SmolLM2: Wanneer Smol Groot Gaat -- Data-Centrische Training van een Kleine Taalmodel
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model
Loubna Ben Allal, Anton Lozhkov, Elie Bakouch, Gabriel Martín Blázquez, Guilherme Penedo, Lewis Tunstall, Andrés Marafioti, Hynek Kydlíček, Agustín Piqueres Lajarín, Vaibhav Srivastav, Joshua Lochner, Caleb Fahlgren, Xuan-Son Nguyen, Clémentine Fourrier, Ben Burtenshaw, Hugo Larcher, Haojun Zhao, Cyril Zakka, Mathieu Morlon, Colin Raffel, Leandro von Werra, Thomas Wolf
•
Feb 4, 2025
•
228
6
LIMO: Minder is Meer voor Redeneren
LIMO: Less is More for Reasoning
Yixin Ye, Zhen Huang, Yang Xiao, Ethan Chern, Shijie Xia, Pengfei Liu
•
Feb 5, 2025
•
61
4
Token Assortiment: Het Mengen van Latente en Tekst Tokens voor Verbeterde Taalmodelredenering
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning
DiJia Su, Hanlin Zhu, Yingchen Xu, Jiantao Jiao, Yuandong Tian, Qinqing Zheng
•
Feb 5, 2025
•
17
2
Samenvoeging van Grote Taalmodellen op Basis van Activatie
Activation-Informed Merging of Large Language Models
Amin Heyrani Nobari, Kaveh Alimohammadi, Ali ArjomandBigdeli, Akash Srivastava, Faez Ahmed, Navid Azizan
•
Feb 4, 2025
•
6
2
Jailbreaking met Universele Multi-Prompts
Jailbreaking with Universal Multi-Prompts
Yu-Ling Hsu, Hsuan Su, Shang-Tse Chen
•
Feb 3, 2025
•
9
2