ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
February 6th, 2025
HackerRank-ASTRA: Оценка правильности и согласованности больших языковых моделей на многофайловых проектах с кросс-доменными проблемами.
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems
Jun Xing, Mayur Bhatia, Sahil Phulwani, Darshan Suresh, Rafik Matta
•
Jan 31, 2025
•
0
2
LayerTracer: Синтез SVG в слоях, выровненный по когнитивным принципам, с использованием трансформера диффузии
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
Yiren Song, Danze Chen, Mike Zheng Shou
•
Feb 3, 2025
•
20
4
Загадка для вас! Скрытый вывод членства для генерации с усилением поиска
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation
Ali Naseh, Yuefeng Peng, Anshuman Suri, Harsh Chaudhari, Alina Oprea, Amir Houmansadr
•
Feb 1, 2025
•
5
2
TwinMarket: Масштабируемая поведенческая и социальная симуляция для финансовых рынков
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets
Yuzhe Yang, Yifei Zhang, Minghao Wu, Kaidi Zhang, Yunmiao Zhang, Honghai Yu, Yan Hu, Benyou Wang
•
Feb 3, 2025
•
38
3
Усиление мультимодального рассуждения с MCTS-автоматизированным структурированным мышлением
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking
Jinyang Wu, Mingkuan Feng, Shuai Zhang, Ruihan Jin, Feihu Che, Zengqi Wen, Jianhua Tao
•
Feb 4, 2025
•
22
4
Создание кода с самоотлаживанием под руководством большой языковой модели
Large Language Model Guided Self-Debugging Code Generation
Muntasir Adnan, Zhiwei Xu, Carlos C. N. Kuhn
•
Feb 5, 2025
•
13
2
Расшифровка длинных цепочек рассуждений в LLMs
Demystifying Long Chain-of-Thought Reasoning in LLMs
Edward Yeo, Yuxuan Tong, Morry Niu, Graham Neubig, Xiang Yue
•
Feb 5, 2025
•
59
3
О Взломе Учителя в Дистилляции Языковой Модели
On Teacher Hacking in Language Model Distillation
Daniil Tiapkin, Daniele Calandriello, Johan Ferret, Sarah Perrin, Nino Vieillard, Alexandre Ramé, Mathieu Blondel
•
Feb 4, 2025
•
18
2
Вероятностный подход к масштабированию LLM во время вывода с использованием методов Монте-Карло на основе частиц
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods
Isha Puri, Shivchander Sudalairaj, Guangxuan Xu, Kai Xu, Akash Srivastava
•
Feb 3, 2025
•
10
3
SmolLM2: Когда маленькое становится большим - Данные-центричное обучение небольшой языковой модели
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model
Loubna Ben Allal, Anton Lozhkov, Elie Bakouch, Gabriel Martín Blázquez, Guilherme Penedo, Lewis Tunstall, Andrés Marafioti, Hynek Kydlíček, Agustín Piqueres Lajarín, Vaibhav Srivastav, Joshua Lochner, Caleb Fahlgren, Xuan-Son Nguyen, Clémentine Fourrier, Ben Burtenshaw, Hugo Larcher, Haojun Zhao, Cyril Zakka, Mathieu Morlon, Colin Raffel, Leandro von Werra, Thomas Wolf
•
Feb 4, 2025
•
228
6
ЛИМО: Меньше - значит больше для рассуждений
LIMO: Less is More for Reasoning
Yixin Ye, Zhen Huang, Yang Xiao, Ethan Chern, Shijie Xia, Pengfei Liu
•
Feb 5, 2025
•
61
4
Смешанный токен: комбинирование скрытых и текстовых токенов для улучшения лингвистического моделирования.
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning
DiJia Su, Hanlin Zhu, Yingchen Xu, Jiantao Jiao, Yuandong Tian, Qinqing Zheng
•
Feb 5, 2025
•
17
2
Слияние больших языковых моделей на основе активации.
Activation-Informed Merging of Large Language Models
Amin Heyrani Nobari, Kaveh Alimohammadi, Ali ArjomandBigdeli, Akash Srivastava, Faez Ahmed, Navid Azizan
•
Feb 4, 2025
•
6
2
Взлом с использованием универсальных мульти-подсказок.
Jailbreaking with Universal Multi-Prompts
Yu-Ling Hsu, Hsuan Su, Shang-Tse Chen
•
Feb 3, 2025
•
9
2