ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 14th, 2025
PixelFlow: Генеративные модели в пространстве пикселей с использованием потоков
PixelFlow: Pixel-Space Generative Models with Flow
Shoufa Chen, Chongjian Ge, Shilong Zhang, Peize Sun, Ping Luo
•
Apr 10, 2025
•
19
6
InteractVLM: Рассуждения о 3D-взаимодействиях на основе 2D-фундаментальных моделей
InteractVLM: 3D Interaction Reasoning from 2D Foundational Models
Sai Kumar Dwivedi, Dimitrije Antić, Shashank Tripathi, Omid Taheri, Cordelia Schmid, Michael J. Black, Dimitrios Tzionas
•
Apr 7, 2025
•
5
2
SQL-R1: Обучение модели преобразования естественного языка в SQL с использованием обучения с подкреплением
SQL-R1: Training Natural Language to SQL Reasoning Model By Reinforcement Learning
Peixian Ma, Xialie Zhuang, Chengjin Xu, Xuhui Jiang, Ran Chen, Jian Guo
•
Apr 11, 2025
•
26
2
SAE могут улучшить процесс "забывания": Динамические разреженные автоэнкодеры как защитные механизмы для точного "забывания" в больших языковых моделях
SAEs Can Improve Unlearning: Dynamic Sparse Autoencoder Guardrails for Precision Unlearning in LLMs
Aashiq Muhamed, Jacopo Bonato, Mona Diab, Virginia Smith
•
Apr 11, 2025
•
4
2
BlenderGym: Бенчмаркинг систем базовых моделей для редактирования графики
BlenderGym: Benchmarking Foundational Model Systems for Graphics Editing
Yunqi Gu, Ian Huang, Jihyeon Je, Guandao Yang, Leonidas Guibas
•
Apr 2, 2025
•
6
2
Понимают ли языковые модели уровня PhD элементарное сложение? Исследование обучения правилам против запоминания в больших языковых моделях
Do PhD-level LLMs Truly Grasp Elementary Addition? Probing Rule Learning vs. Memorization in Large Language Models
Yang Yan, Yu Lu, Renjun Xu, Zhenzhong Lan
•
Apr 7, 2025
•
11
6
Бесплатное управление в генерации видео из текста с помощью мультимодального планирования и структурированной инициализации шума
Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization
Jialu Li, Shoubin Yu, Han Lin, Jaemin Cho, Jaehong Yoon, Mohit Bansal
•
Apr 11, 2025
•
7
2
UKBOB: Один миллиард размеченных масок МРТ для обобщаемой 3D-сегментации медицинских изображений
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation
Emmanuelle Bourigault, Amir Jamaludin, Abdullah Hamdi
•
Apr 9, 2025
•
7
2
In-2-4D: Интерполяция между двумя одноракурсными изображениями для генерации 4D
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation
Sauradip Nag, Daniel Cohen-Or, Hao Zhang, Ali Mahdavi-Amiri
•
Apr 11, 2025
•
10
2
ZipIR: Трансформер с латентной пирамидальной диффузией для восстановления изображений высокого разрешения
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration
Yongsheng Yu, Haitian Zheng, Zhifei Zhang, Jianming Zhang, Yuqian Zhou, Connelly Barnes, Yuchen Liu, Wei Xiong, Zhe Lin, Jiebo Luo
•
Apr 11, 2025
•
18
2
Визуальные хроники: применение мультимодальных больших языковых моделей для анализа обширных коллекций изображений
Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images
Boyang Deng, Songyou Peng, Kyle Genova, Gordon Wetzstein, Noah Snavely, Leonidas Guibas, Thomas Funkhouser
•
Apr 11, 2025
•
11
2
FlexIP: Динамическое управление сохранением и индивидуальностью для персонализированной генерации изображений
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation
Linyan Huang, Haonan Lin, Yanning Zhou, Kaiwen Xiao
•
Apr 10, 2025
•
12
2
Латентные диффузионные автоэнкодеры: к эффективному и содержательному обучению представлений без учителя в медицинской визуализации
Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging
Gabriele Lozupone, Alessandro Bria, Francesco Fontanella, Frederick J. A. Meijer, Claudio De Stefano, Henkjan Huisman
•
Apr 11, 2025
•
5
2
VLM-R1: Стабильная и обобщаемая крупномасштабная модель обработки визуально-языковых данных в стиле R1
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model
Haozhan Shen, Peng Liu, Jingcheng Li, Chunxin Fang, Yibo Ma, Jiajia Liao, Qiaoli Shen, Zilun Zhang, Kangjia Zhao, Qianqian Zhang, Ruochen Xu, Tiancheng Zhao
•
Apr 10, 2025
•
31
2
ModernBERT или DeBERTaV3? Исследование влияния архитектуры и данных на производительность моделей с трансформерным кодировщиком
ModernBERT or DeBERTaV3? Examining Architecture and Data Influence on Transformer Encoder Models Performance
Wissam Antoun, Benoît Sagot, Djamé Seddah
•
Apr 11, 2025
•
10
3
GigaTok: Масштабирование визуальных токенизаторов до 3 миллиардов параметров для авторегрессивной генерации изображений
GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation
Tianwei Xiong, Jun Hao Liew, Zilong Huang, Jiashi Feng, Xihui Liu
•
Apr 11, 2025
•
47
2
Seaweed-7B: Экономически эффективное обучение базовой модели для генерации видео
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Team Seawead, Ceyuan Yang, Zhijie Lin, Yang Zhao, Shanchuan Lin, Zhibei Ma, Haoyuan Guo, Hao Chen, Lu Qi, Sen Wang, Feng Cheng, Feilong Zuo Xuejiao Zeng, Ziyan Yang, Fangyuan Kong, Zhiwu Qing, Fei Xiao, Meng Wei, Tuyen Hoang, Siyu Zhang, Peihao Zhu, Qi Zhao, Jiangqiao Yan, Liangke Gui, Sheng Bi, Jiashi Li, Yuxi Ren, Rui Wang, Huixia Li, Xuefeng Xiao, Shu Liu, Feng Ling, Heng Zhang, Houmin Wei, Huafeng Kuang, Jerry Duncan, Junda Zhang, Junru Zheng, Li Sun, Manlin Zhang, Renfei Sun, Xiaobin Zhuang, Xiaojie Li, Xin Xia, Xuyan Chi, Yanghua Peng, Yuping Wang, Yuxuan Wang, Zhongkai Zhao, Zhuo Chen, Zuquan Song, Zhenheng Yang, Jiashi Feng, Jianchao Yang, Lu Jiang
•
Apr 11, 2025
•
122
11
MineWorld: интерактивная модель мира в реальном времени с открытым исходным кодом на базе Minecraft
MineWorld: a Real-Time and Open-Source Interactive World Model on Minecraft
Junliang Guo, Yang Ye, Tianyu He, Haoyu Wu, Yushu Jiang, Tim Pearce, Jiang Bian
•
Apr 11, 2025
•
39
3
SpecReason: Быстрые и точные вычисления во время вывода с использованием спекулятивного рассуждения
SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning
Rui Pan, Yinwei Dai, Zhihao Zhang, Gabriele Oliaro, Zhihao Jia, Ravi Netravali
•
Apr 10, 2025
•
5
2
CoRAG: Совместная генерация с расширением на основе поиска
CoRAG: Collaborative Retrieval-Augmented Generation
Aashiq Muhamed, Mona Diab, Virginia Smith
•
Apr 2, 2025
•
10
2