ChatPaper.ai
Открыть меню
Главная
Статьи Дня
arXiv
HuggingFace
Цены
Аккаунт
Рабочее пространство
🇷🇺
Русский
Loading...
•
•
•
•
•
•
•
•
•
•
Ежедневные Исследовательские Статьи по ИИ
Ежедневно отобранные исследовательские статьи по ИИ с переводами
January 3rd, 2025
MLLM в качестве судьи для безопасности изображений без маркировки людей
MLLM-as-a-Judge for Image Safety without Human Labeling
Zhenting Wang, Shuming Hu, Shiyu Zhao, Xiaowen Lin, Felix Juefei-Xu, Zhuowei Li, Ligong Han, Harihar Subramanyam, Li Chen, Jianfa Chen, Nan Jiang, Lingjuan Lyu, Shiqing Ma, Dimitris N. Metaxas, Ankit Jain
•
Dec 31, 2024
•
31
2
SeFAR: Полу-надзорное распознавание действий с тонкой детализацией с временными возмущениями и стабилизацией обучения
SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization
Yongle Huang, Haodong Chen, Zhenbang Xu, Zihan Jia, Haozhou Sun, Dian Shao
•
Jan 2, 2025
•
5
2
CodeElo: Оценка конкурентоспособного уровня генерации кода LLM с рейтингами Elo, сравнимыми с человеческими.
CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings
Shanghaoran Quan, Jiaxi Yang, Bowen Yu, Bo Zheng, Dayiheng Liu, An Yang, Xuancheng Ren, Bofei Gao, Yibo Miao, Yunlong Feng, Zekun Wang, Jian Yang, Zeyu Cui, Yang Fan, Yichang Zhang, Binyuan Hui, Junyang Lin
•
Jan 2, 2025
•
53
6
A3: Арена агентов Android для мобильных GUI-агентов
A3: Android Agent Arena for Mobile GUI Agents
Yuxiang Chai, Hanhao Li, Jiayu Zhang, Liang Liu, Guozhi Wang, Shuai Ren, Siyuan Huang, Hongsheng Li
•
Jan 2, 2025
•
22
3
Понимание и устранение узких мест моделей пространства состояний через призму недавности и переусреднения.
Understanding and Mitigating Bottlenecks of State Space Models through the Lens of Recency and Over-smoothing
Peihao Wang, Ruisi Cai, Yuehao Wang, Jiajun Zhu, Pragya Srivastava, Zhangyang Wang, Pan Li
•
Dec 31, 2024
•
7
2
VideoRefer Suite: Развитие пространственно-временного понимания объектов с помощью видео LLM
VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM
Yuqian Yuan, Hang Zhang, Wentong Li, Zesen Cheng, Boqiang Zhang, Long Li, Xin Li, Deli Zhao, Wenqiao Zhang, Yueting Zhuang, Jianke Zhu, Lidong Bing
•
Dec 31, 2024
•
48
2
Реконструкция против Генерации: Укрощение Дилеммы Оптимизации в Моделях Латентной Диффузии
Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models
Jingfeng Yao, Xinggang Wang
•
Jan 2, 2025
•
43
2
2.5 года в классе: мультимодальный учебник для предварительного обучения видео-языковому взаимодействию
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining
Wenqi Zhang, Hang Zhang, Xin Li, Jiashuo Sun, Yongliang Shen, Weiming Lu, Deli Zhao, Yueting Zhuang, Lidong Bing
•
Jan 1, 2025
•
107
7
ПрогКо: программа помогает самокоррекции больших языковых моделей
ProgCo: Program Helps Self-Correction of Large Language Models
Xiaoshuai Song, Yanan Wu, Weixun Wang, Jiaheng Liu, Wenbo Su, Bo Zheng
•
Jan 2, 2025
•
27
2
MapQaTor: Система для эффективной разметки наборов данных запросов карт.
MapQaTor: A System for Efficient Annotation of Map Query Datasets
Mahir Labib Dihan, Mohammed Eunus Ali, Md Rizwan Parvez
•
Dec 30, 2024
•
10
2
Динамическое масштабирование модульных тестов для моделирования кода вознаграждения.
Dynamic Scaling of Unit Tests for Code Reward Modeling
Zeyao Ma, Xiaokang Zhang, Jing Zhang, Jifan Yu, Sijia Luo, Jie Tang
•
Jan 2, 2025
•
17
2
Вложенное внимание: семантически осознанные значения внимания для персонализации концепций.
Nested Attention: Semantic-aware Attention Values for Concept Personalization
Or Patashnik, Rinon Gal, Daniil Ostashev, Sergey Tulyakov, Kfir Aberman, Daniel Cohen-Or
•
Jan 2, 2025
•
11
2
VideoAnydoor: Вставка объектов видео высокой точности с точным управлением движением
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control
Yuanpeng Tu, Hao Luo, Xi Chen, Sihui Ji, Xiang Bai, Hengshuang Zhao
•
Jan 2, 2025
•
55
3
SeedVR: Засеивание бесконечности в трансформере диффузии к общему восстановлению видео.
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration
Jianyi Wang, Zhijie Lin, Meng Wei, Yang Zhao, Ceyuan Yang, Chen Change Loy, Lu Jiang
•
Jan 2, 2025
•
11
2
Диффузия, осведомленная о популяции, для генерации временных рядов
Population Aware Diffusion for Time Series Generation
Yang Li, Han Meng, Zhenyu Bi, Ingolv T. Urnes, Haipeng Chen
•
Jan 1, 2025
•
6
2
MapEval: Карта-основанная оценка геопространственного рассуждения в фундаментальных моделях
MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models
Mahir Labib Dihan, Md Tanvir Hassan, Md Tanvir Parvez, Md Hasebul Hasan, Md Almash Alam, Muhammad Aamir Cheema, Mohammed Eunus Ali, Md Rizwan Parvez
•
Dec 31, 2024
•
22
2
Объединение специализированных визуальных кодировщиков для моделей языка на основе видео
Unifying Specialized Visual Encoders for Video Language Models
Jihoon Chung, Tyler Zhu, Max Gonzalez Saez-Diez, Juan Carlos Niebles, Honglu Zhou, Olga Russakovsky
•
Jan 2, 2025
•
21
2
LTX-Видео: Потоковая диффузия латентного видео
LTX-Video: Realtime Video Latent Diffusion
Yoav HaCohen, Nisan Chiprut, Benny Brazowski, Daniel Shalem, Dudu Moshe, Eitan Richardson, Eran Levin, Guy Shiran, Nir Zabari, Ori Gordon, Poriya Panet, Sapir Weissbuch, Victor Kulikov, Yaki Bitterman, Zeev Melumian, Ofir Bibi
•
Dec 30, 2024
•
47
3
Переосмысление адресации в языковых моделях через контекстуализированные эквивариантные позиционные кодирования.
Rethinking Addressing in Language Models via Contexualized Equivariant Positional Encoding
Jiajun Zhu, Peihao Wang, Ruisi Cai, Jason D. Lee, Pan Li, Zhangyang Wang
•
Jan 1, 2025
•
6
4