ChatPaper.aiChatPaper.ai
Главная

arXiv

HuggingFace

ЦеныАккаунтРабочее пространство

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

Ежедневные Исследовательские Статьи по ИИ

Ежедневно отобранные исследовательские статьи по ИИ с переводами

Будет ли это верно завтра? Классификация многоязычных "вечнозеленых" вопросов для повышения доверия к системам вопросно-ответного поиска
Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Sergey Pletenev, Maria Marina, Nikolay Ivanov, Daria Galimzianova, Nikita Krayko, Mikhail Salnikov, Vasily Konovalov, Alexander Panchenko, Viktor Moskvoretskii•May 27, 2025•1114

Использование механизма самовнимания для создания входозависимых мягких подсказок в больших языковых моделях
Leveraging Self-Attention for Input-Dependent Soft Prompting in LLMs

Ananth Muppidi, Abhilash Nandy, Sambaran Bandyopadhyay•Jun 5, 2025•321

MORSE-500: Программно управляемый видеобенчмарк для стресс-тестирования мультимодального мышления
MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Zikui Cai, Andrew Wang, Anirudh Satheesh, Ankit Nakhawa, Hyunwoo Jae, Keenan Powell, Minghui Liu, Neel Jay, Sungbin Oh, Xiyao Wang, Yongyuan Liang, Tom Goldstein, Furong Huang•Jun 5, 2025•311

FusionAudio-1.2M: К детализированному описанию аудио с использованием мультимодального контекстуального слияния
FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion

Shunian Chen, Xinyuan Xie, Zheshu Chen, Liyan Zhao, Owen Lee, Zhan Su, Qilin Sun, Benyou Wang•Jun 1, 2025•292

PartCrafter: Генерация структурированных 3D-сеток с использованием композиционных латентных диффузионных трансформеров
PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers

Yuchen Lin, Chenguo Lin, Panwang Pan, Honglei Yan, Yiqiang Feng, Yadong Mu, Katerina Fragkiadaki•Jun 5, 2025•282

Sentinel: передовая модель для защиты от инъекций в промпты
Sentinel: SOTA model to protect against prompt injections

Dror Ivry, Oran Nahum•Jun 5, 2025•211

Истина в малом: выбор высокоценных данных для эффективного мультимодального рассуждения
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning

Shenshen Li, Kaiyuan Deng, Lei Wang, Hao Yang, Chong Peng, Peng Yan, Fumin Shen, Heng Tao Shen, Xing Xu•Jun 5, 2025•191

Является ли расширение модальности правильным путем к омни-модальности?
Is Extending Modality The Right Path Towards Omni-Modality?

Tinghui Zhu, Kai Zhang, Muhao Chen, Yu Su•Jun 2, 2025•192

STARFlow: Масштабирование латентных нормализующих потоков для синтеза изображений высокого разрешения
STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis

Jiatao Gu, Tianrong Chen, David Berthelot, Huangjie Zheng, Yuyang Wang, Ruixiang Zhang, Laurent Dinh, Miguel Angel Bautista, Josh Susskind, Shuangfei Zhai•Jun 6, 2025•181

Аудио-ориентированные большие языковые модели как судьи стилей речи
Audio-Aware Large Language Models as Judges for Speaking Styles

Cheng-Han Chiang, Xiaofei Wang, Chung-Ching Lin, Kevin Lin, Linjie Li, Radu Kopetz, Yao Qian, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang•Jun 6, 2025•143

Медицинская Мировая Модель: Генеративное Моделирование Эволюции Опухоли для Планирования Лечения
Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning

Yijun Yang, Zhao-Yang Wang, Qiuping Liu, Shuwen Sun, Kang Wang, Rama Chellappa, Zongwei Zhou, Alan Yuille, Lei Zhu, Yu-Dong Zhang, Jieneng Chen•Jun 2, 2025•132

CodeContests+: Генерация высококачественных тестовых случаев для соревновательного программирования
CodeContests+: High-Quality Test Case Generation for Competitive Programming

Zihan Wang, Siyao Liu, Yang Sun, Hongyan Li, Kai Shen•Jun 6, 2025•81

Точность, ранжированная по оценкам экспертов: создание базового набора данных для тонкой настройки моделей компьютерного зрения на основе аннотированных изображений DataSeeds
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery

Sajjad Abdoli, Freeman Lewin, Gediminas Vasiliauskas, Fabian Schonholz•Jun 6, 2025•81

Соединяя перспективы: обзор кросс-взглядного совместного интеллекта с использованием эгоцентрического и эксцентрического зрения
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision

Yuping He, Yifei Huang, Guo Chen, Lidong Lu, Baoqi Pei, Jilan Xu, Tong Lu, Yoichi Sato•Jun 6, 2025•61

Сплаттинг физических сцен: сквозной переход от реальности к симуляции на основе неидеальных роботизированных данных
Splatting Physical Scenes: End-to-End Real-to-Sim from Imperfect Robot Data

Ben Moran, Mauro Comi, Steven Bohez, Tom Erez, Zhibin Li, Leonard Hasenclever•Jun 4, 2025•62

3DFlowAction: Обучение манипуляциям с учетом различных воплощений на основе 3D-потоковой модели мира
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model

Hongyan Zhi, Peihao Chen, Siyuan Zhou, Yubo Dong, Quanxi Wu, Lei Han, Mingkui Tan•Jun 6, 2025•51

MIRIAD: Расширение возможностей языковых моделей с помощью миллионов пар медицинских запросов и ответов
MIRIAD: Augmenting LLMs with millions of medical query-response pairs

Qinyue Zheng, Salman Abdullah, Sam Rawal, Cyril Zakka, Sophie Ostmeier, Maximilian Purk, Eduardo Reis, Eric J. Topol, Jure Leskovec, Michael Moor•Jun 6, 2025•51

HASHIRU: Иерархическая агентная система для гибридного интеллектуального использования ресурсов
HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization

Kunal Pai, Parth Shah, Harshil Patel•Jun 1, 2025•51

Prefix Grouper: Эффективное обучение GRPO с использованием разделяемого префикса в прямом проходе
Prefix Grouper: Efficient GRPO Training through Shared-Prefix Forward

Zikang Liu, Tongtian Yue, Yepeng Tang, Longteng Guo, Junxian Cai, Qingbin Liu, Xi Chen, Jing Liu•Jun 5, 2025•41

Когда модели знают больше, чем могут объяснить: количественная оценка передачи знаний в коллаборации человека и ИИ
When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

Quan Shi, Carlos E. Jimenez, Shunyu Yao, Nick Haber, Diyi Yang, Karthik Narasimhan•Jun 5, 2025•31

Когда семантика вводит зрение в заблуждение: смягчение галлюцинаций в крупных мультимодальных моделях при распознавании и понимании текста в сценах
When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu, Yan Zhang, Gangyan Zeng, Yan Li, Yu Zhou, Ser-Nam Lim, Harry Yang, Nicu Sebe•Jun 5, 2025•31

GuideX: Генерация синтетических данных с управлением для извлечения информации в условиях отсутствия обучающих примеров
GuideX: Guided Synthetic Data Generation for Zero-Shot Information Extraction

Neil De La Fuente, Oscar Sainz, Iker García-Ferrero, Eneko Agirre•May 31, 2025•32

AssetOpsBench: Бенчмарк для ИИ-агентов, автоматизирующих задачи в промышленной эксплуатации и техническом обслуживании активов
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance

Dhaval Patel, Shuxin Lin, James Rayfield, Nianjun Zhou, Roman Vaculin, Natalia Martinez, Fearghal O'donncha, Jayant Kalagnanam•Jun 4, 2025•12

Разреженные модели пространства состояний представляют собой эффективные шоссейные сети.
Sparsified State-Space Models are Efficient Highway Networks

Woomin Song, Jihoon Tack, Sangwoo Mo, Seunghyuk Oh, Jinwoo Shin•May 27, 2025•12