ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
April 3rd, 2025
AnimeGamer: Бесконечная симуляция аниме-жизни с предсказанием следующего игрового состояния
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
Junhao Cheng, Yuying Ge, Yixiao Ge, Jing Liao, Ying Shan
•
Apr 1, 2025
•
66
2
LSNet: Видеть общее, фокусироваться на частном
LSNet: See Large, Focus Small
Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding
•
Mar 29, 2025
•
9
3
VerifiAgent: унифицированный агент верификации в рассуждениях языковых моделей
VerifiAgent: a Unified Verification Agent in Language Model Reasoning
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
•
Apr 1, 2025
•
6
2
Целеориентированные модели видеодиффузии
Target-Aware Video Diffusion Models
Taeksoo Kim, Hanbyul Joo
•
Mar 24, 2025
•
5
2
MegaTTS 3: Трансформер с латентной диффузией и улучшенным разреженным выравниванием для синтеза речи в условиях zero-shot
MegaTTS 3: Sparse Alignment Enhanced Latent Diffusion Transformer for Zero-Shot Speech Synthesis
Ziyue Jiang, Yi Ren, Ruiqi Li, Shengpeng Ji, Boyang Zhang, Zhenhui Ye, Chen Zhang, Bai Jionghao, Xiaoda Yang, Jialong Zuo, Yu Zhang, Rui Liu, Xiang Yin, Zhou Zhao
•
Feb 26, 2025
•
12
2
Улучшенное визуально-пространственное мышление с помощью обучения, подобного R1-Zero
Improved Visual-Spatial Reasoning via R1-Zero-Like Training
Zhenyi Liao, Qingsong Xie, Yanhao Zhang, Zijian Kong, Haonan Lu, Zhenyu Yang, Zhijie Deng
•
Apr 1, 2025
•
62
3
MergeVQ: Единая структура для визуальной генерации и представления с разделенным объединением и квантованием токенов
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization
Siyuan Li, Luyuan Zhang, Zedong Wang, Juanxi Tian, Cheng Tan, Zicheng Liu, Chang Yu, Qingsong Xie, Haonan Lu, Haoqian Wang, Zhen Lei
•
Apr 1, 2025
•
87
7
Адаптивное пропусканье слоев в предобученных больших языковых моделях
Adaptive Layer-skipping in Pre-trained LLMs
Xuan Luo, Weizhi Wang, Xifeng Yan
•
Mar 31, 2025
•
6
2
Понимание обучения по типу R1-Zero: критический взгляд
Understanding R1-Zero-Like Training: A Critical Perspective
Zichen Liu, Changyu Chen, Wenjun Li, Penghui Qi, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin
•
Mar 26, 2025
•
47
3
ILLUME+: Освещение унифицированной MLLM с двойной визуальной токенизацией и диффузионным уточнением
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement
Runhui Huang, Chunwei Wang, Junwei Yang, Guansong Lu, Yunlong Yuan, Jianhua Han, Lu Hou, Wei Zhang, Lanqing Hong, Hengshuang Zhao, Hang Xu
•
Apr 2, 2025
•
23
4
Медицинские большие языковые модели легко отвлекаются.
Medical large language models are easily distracted
Krithik Vishwanath, Anton Alyakin, Daniel Alexander Alber, Jin Vivian Lee, Douglas Kondziolka, Eric Karl Oermann
•
Apr 1, 2025
•
3
2
ScholarCopilot: Обучение крупных языковых моделей для академического письма с точным цитированием
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations
Yubo Wang, Xueguang Ma, Ping Nie, Huaye Zeng, Zhiheng Lyu, Yuxuan Zhang, Benjamin Schneider, Yi Lu, Xiang Yue, Wenhu Chen
•
Apr 1, 2025
•
40
2
VideoScene: Дистилляция модели диффузии видео для генерации 3D-сцен за один шаг
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step
Hanyang Wang, Fangfu Liu, Jiawei Chi, Yueqi Duan
•
Apr 2, 2025
•
40
2
DASH: Обнаружение и оценка систематических галлюцинаций в визуально-языковых моделях
DASH: Detection and Assessment of Systematic Hallucinations of VLMs
Maximilian Augustin, Yannic Neuhaus, Matthias Hein
•
Mar 30, 2025
•
12
2
Quamba2: Надежная и Масштабируемая Framework для Посттренировочной Квантования Селективных Моделей с Состояниями
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models
Hung-Yueh Chiang, Chi-Chih Chang, Natalia Frumkin, Kai-Chiang Wu, Mohamed S. Abdelfattah, Diana Marculescu
•
Mar 28, 2025
•
10
2
Защита моделей "визуальный язык": снижение уязвимостей к гауссовскому шуму в атаках на основе возмущений
Safeguarding Vision-Language Models: Mitigating Vulnerabilities to Gaussian Noise in Perturbation-based Attacks
Jiawei Wang, Yushen Zuo, Yuanjun Chai, Zhendong Liu, Yichen Fu, Yichun Feng, Kin-man Lam
•
Apr 2, 2025
•
13
2
PaperBench: Оценка способности ИИ воспроизводить исследования в области ИИ
PaperBench: Evaluating AI's Ability to Replicate AI Research
Giulio Starace, Oliver Jaffe, Dane Sherburn, James Aung, Jun Shern Chan, Leon Maksin, Rachel Dias, Evan Mays, Benjamin Kinsella, Wyatt Thompson, Johannes Heidecke, Amelia Glaese, Tejal Patwardhan
•
Apr 2, 2025
•
36
2
Улучшенное обнаружение данных вне распределения через кросс-модальное согласование мультимодальных представлений
Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations
Jeonghyeon Kim, Sangheum Hwang
•
Mar 24, 2025
•
4
1
Улучшите свою модель генерации изображений людей с помощью оптимизации прямых предпочтений на основе обратной связи от ИИ
Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback
Sanghyeon Na, Yonggyu Kim, Hyunjoon Lee
•
May 30, 2024
•
22
3
К созданию физически правдоподобной генерации видео через планирование с использованием языковых моделей (VLM)
Towards Physically Plausible Video Generation via VLM Planning
Xindi Yang, Baolu Li, Yiming Zhang, Zhenfei Yin, Lei Bai, Liqian Ma, Zhiyong Wang, Jianfei Cai, Tien-Tsin Wong, Huchuan Lu, Xu Jia
•
Mar 30, 2025
•
39
3
DreamActor-M1: Целостная, выразительная и устойчивая анимация изображений человека с гибридным управлением
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
Yuxuan Luo, Zhengkun Rong, Lizhen Wang, Longhao Zhang, Tianshu Hu, Yongming Zhu
•
Apr 2, 2025
•
65
7
Дистилляция артикулированной кинематики из видеодиффузионных моделей
Articulated Kinematics Distillation from Video Diffusion Models
Xuan Li, Qianli Ma, Tsung-Yi Lin, Yongxin Chen, Chenfanfu Jiang, Ming-Yu Liu, Donglai Xiang
•
Apr 1, 2025
•
24
3