ChatPaper.aiChatPaper.ai
ホーム

arXiv

HuggingFace

料金プランアカウントワークスペース

•
•

•
•

•
•

•
•

•
•

Footer

Company name

ChatPaper.ai: Your advanced AI reading assistant.

Contact us: [email protected]

X (Twitter)

Products

  • AI Search
  • AI Mind Map
  • Arxiv Summary
  • Huggingface Summary

Support

  • FAQ
  • Contact

Company

  • Blog
  • Privacy Policy
  • Terms of Service

Available Languages

  • 🇬🇧English
  • 🇨🇳中文简体
  • 🇭🇰繁體中文
  • 🇯🇵日本語
  • 🇰🇷한국어
  • 🇩🇪Deutsch
  • 🇫🇷Français
  • 🇷🇺Русский
  • 🇪🇸Español

© 2025 chatpaper.ai All rights reserved.

AI研究論文デイリー

翻訳付きの日次キュレーションされたAI研究論文

知識拡張型テキスト-to-SQLのための知識ベース構築
Knowledge Base Construction for Knowledge-Augmented Text-to-SQL

Jinheon Baek, Horst Samulowitz, Oktie Hassanzadeh, Dharmashankar Subramanian, Sola Shirai, Alfio Gliozzo, Debarun Bhattacharjya•May 28, 2025•11

複雑な指示追従のための逆選好最適化
Reverse Preference Optimization for Complex Instruction Following

Xiang Huang, Ting-En Lin, Feiteng Fang, Yuchuan Wu, Hangyu Li, Yuzhong Qu, Fei Huang, Yongbin Li•May 28, 2025•31

推論言語モデルのための強化学習におけるエントロピー機構
The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Ganqu Cui, Yuchen Zhang, Jiacheng Chen, Lifan Yuan, Zhi Wang, Yuxin Zuo, Haozhan Li, Yuchen Fan, Huayu Chen, Weize Chen, Zhiyuan Liu, Hao Peng, Lei Bai, Wanli Ouyang, Yu Cheng, Bowen Zhou, Ning Ding•May 28, 2025•1123

SWE-rebench:ソフトウェアエンジニアリングエージェントのタスク収集と クリーンな評価のための自動化パイプライン
SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents

Ibragim Badertdinov, Alexander Golubev, Maksim Nekrashevich, Anton Shevtsov, Simon Karasik, Andrei Andriushchenko, Maria Trofimova, Daria Litvintseva, Boris Yangel•May 26, 2025•842

R2R:スモール・ラージモデルトークンルーティングによる多様な推論パスの効率的なナビゲーション
R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing

Tianyu Fu, Yi Ge, Yichen You, Enshu Liu, Zhihang Yuan, Guohao Dai, Shengen Yan, Huazhong Yang, Yu Wang•May 27, 2025•682

Skywork Open Reasoner 1 技術レポート
Skywork Open Reasoner 1 Technical Report

Jujie He, Jiacai Liu, Chris Yuhao Liu, Rui Yan, Chaojie Wang, Peng Cheng, Xiaoyu Zhang, Fuxiang Zhang, Jiacheng Xu, Wei Shen, Siyuan Li, Liang Zeng, Tianwen Wei, Cheng Cheng, Bo An, Yang Liu, Yahui Zhou•May 28, 2025•526

Sherlock: 視覚言語モデルにおける自己修正推論
Sherlock: Self-Correcting Reasoning in Vision-Language Models

Yi Ding, Ruqi Zhang•May 28, 2025•502

GRPOによるマルチモーダルLLM推論のための教師なしポストトレーニング
Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

Lai Wei, Yuting Li, Chen Wang, Yue Wang, Linghe Kong, Weiran Huang, Lichao Sun•May 28, 2025•452

Chain-of-Zoom: スケール自己回帰と選好アライメントによる極限超解像
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Bryan Sangwoo Kim, Jeongsol Kim, Jong Chul Ye•May 24, 2025•434

SageAttention2++: SageAttention2のより効率的な実装
SageAttention2++: A More Efficient Implementation of SageAttention2

Jintao Zhang, Xiaoming Xu, Jia Wei, Haofeng Huang, Pengle Zhang, Chendong Xiang, Jun Zhu, Jianfei Chen•May 27, 2025•412

コールドスタートによる強化学習を活用したマルチモーダル推論の進展
Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start

Lai Wei, Yuting Li, Kaipeng Zheng, Chen Wang, Yue Wang, Linghe Kong, Lichao Sun, Weiran Huang•May 28, 2025•362

RenderFormer: トランスフォーマーベースの三角形メッシュのニューラルレンダリングとグローバルイルミネーション
RenderFormer: Transformer-based Neural Rendering of Triangle Meshes with Global Illumination

Chong Zeng, Yue Dong, Pieter Peers, Hongzhi Wu, Xin Tong•May 28, 2025•333

次イベント予測による映像推論の促進
Fostering Video Reasoning via Next-Event Prediction

Haonan Wang, Hongfu Liu, Xiangyan Liu, Chao Du, Kenji Kawaguchi, Ye Wang, Tianyu Pang•May 28, 2025•272

DeepResearchGym: 自由で透明性が高く再現可能な深層研究評価のためのサンドボックス
DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research

João Coelho, Jingjie Ning, Jingyuan He, Kangrui Mao, Abhijay Paladugu, Pranav Setlur, Jiahe Jin, Jamie Callan, João Magalhães, Bruno Martins, Chenyan Xiong•May 25, 2025•252

エンタープライズシステムにおけるドメイン固有検索のためのハードネガティブマイニング
Hard Negative Mining for Domain-Specific Retrieval in Enterprise Systems

Hansa Meghwani, Amit Agarwal, Priyaranjan Pattnayak, Hitesh Laxmichand Patel, Srikant Panda•May 23, 2025•252

FS-DAG: 視覚的にリッチな文書理解のためのFew Shotドメイン適応グラフネットワーク
FS-DAG: Few Shot Domain Adapting Graph Networks for Visually Rich Document Understanding

Amit Agarwal, Srikant Panda, Kulbhushan Pachauri•May 22, 2025•222

ユニバーサル・リーズナー:凍結されたLLMのための単一で構成可能なプラグアンドプレイ型推論器
Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs

Jaemin Kim, Hangeol Chang, Hyunmin Hwang, Choonghan Kim, Jong Chul Ye•May 25, 2025•212

WebDancer:自律的情報探索エージェントに向けて
WebDancer: Towards Autonomous Information Seeking Agency

Jialong Wu, Baixuan Li, Runnan Fang, Wenbiao Yin, Liwen Zhang, Zhengwei Tao, Dingchu Zhang, Zekun Xi, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou•May 28, 2025•185

言語を超えた品質評価:言語モデルを用いた多言語事前学習データフィルタリングのアプローチ
Judging Quality Across Languages: A Multilingual Approach to Pretraining Data Filtering with Language Models

Mehdi Ali, Manuel Brack, Max Lübbering, Elias Wendt, Abbas Goher Khan, Richard Rutmann, Alex Jude, Maurice Kraus, Alexander Arno Weber, Felix Stollenwerk, David Kaczér, Florian Mai, Lucie Flek, Rafet Sifa, Nicolas Flores-Herr, Joachim Köhler, Patrick Schramowski, Michael Fromm, Kristian Kersting•May 28, 2025•182

文ごとに予測してみましょう
Let's Predict Sentence by Sentence

Hyeonbin Hwang, Byeongguk Jeon, Seungone Kim, Jiyeon Kim, Hoyeon Chang, Sohee Yang, Seungpil Won, Dohaeng Lee, Youbin Ahn, Minjoon Seo•May 28, 2025•172

安定拡散を用いたテキストから360度パノラマ生成を実現する要素とは何か?
What Makes for Text to 360-degree Panorama Generation with Stable Diffusion?

Jinhong Ni, Chang-Bin Zhang, Qiang Zhang, Jing Zhang•May 28, 2025•152

SVRPBench:確率的車両経路問題のための現実的なベンチマーク
SVRPBench: A Realistic Benchmark for Stochastic Vehicle Routing Problem

Ahmed Heakl, Yahia Salaheldin Shaaban, Martin Takac, Salem Lahlou, Zangir Iklassov•May 28, 2025•152

LLMにおけるパーソナライズされた安全性:ベンチマークとプランニングベースのエージェントアプローチ
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach

Yuchen Wu, Edward Sun, Kaijie Zhu, Jianxun Lian, Jose Hernandez-Orallo, Aylin Caliskan, Jindong Wang•May 24, 2025•142

トークン削減は生成モデルにおいて効率性を超えるべきである - 視覚、言語からマルチモーダリティへ
Token Reduction Should Go Beyond Efficiency in Generative Models -- From Vision, Language to Multimodality

Zhenglun Kong, Yize Li, Fanhu Zeng, Lei Xin, Shvat Messica, Xue Lin, Pu Zhao, Manolis Kellis, Hao Tang, Marinka Zitnik•May 23, 2025•143

動的な心の理論に向けて:人間の状態の時間的変化に対するLLMの適応性の評価
Towards Dynamic Theory of Mind: Evaluating LLM Adaptation to Temporal Evolution of Human States

Yang Xiao, Jiashuo Wang, Qiancheng Xu, Changhe Song, Chunpu Xu, Yi Cheng, Wenjie Li, Pengfei Liu•May 23, 2025•142

生成画像を用いた思考
Thinking with Generated Images

Ethan Chern, Zhulin Hu, Steffi Chern, Siqi Kou, Jiadi Su, Yan Ma, Zhijie Deng, Pengfei Liu•May 28, 2025•133

CHIMERA: 科学文献におけるアイデア再結合の知識ベース
CHIMERA: A Knowledge Base of Idea Recombination in Scientific Literature

Noy Sternlicht, Tom Hope•May 27, 2025•133

マルチターン推論を強化するためのLLMエージェントにおけるターンレベル信用割当
Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Credit Assignment

Siliang Zeng, Quan Wei, William Brown, Oana Frunza, Yuriy Nevmyvaka, Mingyi Hong•May 17, 2025•132

LIMOPro: 効率的かつ効果的なテスト時スケーリングのための推論改良
LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling

Yang Xiao, Jiashuo Wang, Ruifeng Yuan, Chunpu Xu, Kaishuai Xu, Wenjie Li, Pengfei Liu•May 25, 2025•122

VRAG-RL:強化学習による反復的推論を活用した視覚的豊富な情報理解のための視覚知覚ベースRAGの強化
VRAG-RL: Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning

Qiuchen Wang, Ruixue Ding, Yu Zeng, Zehui Chen, Lin Chen, Shihang Wang, Pengjun Xie, Fei Huang, Feng Zhao•May 28, 2025•103

EPiC:精密なアンカー-ビデオガイダンスによる効率的なビデオカメラ制御学習
EPiC: Efficient Video Camera Control Learning with Precise Anchor-Video Guidance

Zun Wang, Jaemin Cho, Jialu Li, Han Lin, Jaehong Yoon, Yue Zhang, Mohit Bansal•May 28, 2025•92

RICO: 視覚的再構成による画像再キャプションの精度と完全性の向上
RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

Yuchi Wang, Yishuo Cai, Shuhuai Ren, Sihan Yang, Linli Yao, Yuanxin Liu, Yuanxing Zhang, Pengfei Wan, Xu Sun•May 28, 2025•72

PrismLayers: 高品質な多層透明画像生成モデルのためのオープンデータ
PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

Junwen Chen, Heyang Jiang, Yanbin Wang, Keming Wu, Ji Li, Chao Zhang, Keiji Yanai, Dong Chen, Yuhui Yuan•May 28, 2025•62

Text2Grad: 自然言語フィードバックからの強化学習
Text2Grad: Reinforcement Learning from Natural Language Feedback

Hanyang Wang, Lu Wang, Chaoyun Zhang, Tianjun Mao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang•May 28, 2025•62

ルールおよびモデルベース検証器の落とし穴――数学的推論に関する事例研究
Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Yuzhen Huang, Weihao Zeng, Xingshan Zeng, Qi Zhu, Junxian He•May 28, 2025•62

Prot2Token: 次トークン予測によるタンパク質モデリングのための統合フレームワーク
Prot2Token: A Unified Framework for Protein Modeling via Next-Token Prediction

Mahdi Pourmirzaei, Farzaneh Esmaili, Salhuldin Alqarghuli, Mohammadreza Pourmirzaei, Ye Han, Kai Chen, Mohsen Rezaei, Duolin Wang, Dong Xu•May 26, 2025•62

MangaVQAとMangaLMM:マルチモーダルなマンガ理解のためのベンチマークと専門モデル
MangaVQA and MangaLMM: A Benchmark and Specialized Model for Multimodal Manga Understanding

Jeonghun Baek, Kazuki Egashira, Shota Onohara, Atsuyuki Miyai, Yuki Imajuku, Hikaru Ikuta, Kiyoharu Aizawa•May 26, 2025•62

片道切符:テキストから画像への拡散モデル蒸縮のための時間非依存統合エンコーダ
One-Way Ticket:Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

Senmao Li, Lei Wang, Kai Wang, Tao Liu, Jiehang Xie, Joost van de Weijer, Fahad Shahbaz Khan, Shiqi Yang, Yaxing Wang, Jian Yang•May 28, 2025•52

人間がワクチンを必要とするように、モデルも必要とする:虚偽に対抗するためのモデル免疫化
Just as Humans Need Vaccines, So Do Models: Model Immunization to Combat Falsehoods

Shaina Raza, Rizwan Qureshi, Marcelo Lotif, Aman Chadha, Deval Pandya, Christos Emmanouilidis•May 23, 2025•52

Styl3R:任意のシーンとスタイルに対する即時3Dスタイライズド再構成
Styl3R: Instant 3D Stylized Reconstruction for Arbitrary Scenes and Styles

Peng Wang, Xiang Liu, Peidong Liu•May 27, 2025•42

スケールにおける効率的なデータ選択:影響力蒸留によるアプローチ
Efficient Data Selection at Scale via Influence Distillation

Mahdi Nikdan, Vincent Cohen-Addad, Dan Alistarh, Vahab Mirrokni•May 25, 2025•42

GRE Suite:微調整された視覚言語モデルと強化された推論チェーンによる地理的位置推定
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains

Chun Wang, Xiaoran Pan, Zihao Pan, Haofan Wang, Yiren Song•May 24, 2025•42

Safe-Sora: グラフィカル透かしによる安全なテキストから動画生成
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking

Zihan Su, Xuerui Qiu, Hongbin Xu, Tangyu Jiang, Junhao Zhuang, Chun Yuan, Ming Li, Shengfeng He, Fei Richard Yu•May 19, 2025•42

ゼロショット視覚エンコーダグラフトング:LLMサロゲートを介して
Zero-Shot Vision Encoder Grafting via LLM Surrogates

Kaiyu Yue, Vasu Singla, Menglin Jia, John Kirchenbauer, Rifaa Qadri, Zikui Cai, Abhinav Bhatele, Furong Huang, Tom Goldstein•May 28, 2025•32

FastTD3: ヒューマノイド制御のためのシンプルで高速かつ高性能な強化学習
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

Younggyo Seo, Carmelo Sferrazza, Haoran Geng, Michal Nauman, Zhao-Heng Yin, Pieter Abbeel•May 28, 2025•32

AITEE ― 電気工学のためのエージェンシック・チューター
AITEE -- Agentic Tutor for Electrical Engineering

Christopher Knievel, Alexander Bernhardt, Christian Bernhardt•May 27, 2025•32

HoPE: 視覚言語モデルにおける長さ一般化のための位置埋め込みハイブリッド
HoPE: Hybrid of Position Embedding for Length Generalization in Vision-Language Models

Haoran Li, Yingjie Qin, Baoyuan Ou, Lai Xu, Ruiwen Xu•May 26, 2025•32

Hugging Faceナレッジグラフに基づく推薦、分類、追跡のベンチマーキング
Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph

Qiaosheng Chen, Kaijia Huang, Xiao Zhou, Weiqing Luo, Yuanning Cui, Gong Cheng•May 23, 2025•32

メタ学習によるヒト高次視覚野のインコンテキストTransformerモデル
Meta-Learning an In-Context Transformer Model of Human Higher Visual Cortex

Muquan Yu, Mu Nan, Hossein Adeli, Jacob S. Prince, John A. Pyles, Leila Wehbe, Margaret M. Henderson, Michael J. Tarr, Andrew F. Luo•May 21, 2025•32

バイアスの特性評価:簡体字中国語と繁体字中国語における大規模言語モデルのベンチマーキング
Characterizing Bias: Benchmarking Large Language Models in Simplified versus Traditional Chinese

Hanjia Lyu, Jiebo Luo, Jian Kang, Allison Koenecke•May 28, 2025•22

右側が上?MLLMの方向理解を解きほぐす:細粒度の多軸知覚タスクによる分析
Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks

Keanu Nichols, Nazia Tasnim, Yan Yuting, Nicholas Ikechukwu, Elva Zou, Deepti Ghadiyaram, Bryan Plummer•May 27, 2025•22

命令特異的ニューロンとエキスパートの解明:大規模言語モデルの命令追従能力のための分析フレームワーク
Unveiling Instruction-Specific Neurons & Experts: An Analytical Framework for LLM's Instruction-Following Capabilities

Junyan Zhang, Yubo Gao, Yibo Yan, Jungang Li, Zhaorui Hou, Sicheng Tao, Shuliang Liu, Song Dai, Yonghua Hei, Junzhuo Li, Xuming Hu•May 27, 2025•21

MUSEG:タイムスタンプを意識したマルチセグメントグラウンディングによるビデオ時間理解の強化
MUSEG: Reinforcing Video Temporal Understanding via Timestamp-Aware Multi-Segment Grounding

Fuwen Luo, Shengfeng Lou, Chi Chen, Ziyue Wang, Chenliang Li, Weizhou Shen, Jiyue Guo, Peng Li, Ming Yan, Ji Zhang, Fei Huang, Yang Liu•May 27, 2025•22

大規模言語モデルにおける正確なパラメータ内概念消去
Precise In-Parameter Concept Erasure in Large Language Models

Yoav Gur-Arieh, Clara Suslik, Yihuai Hong, Fazl Barez, Mor Geva•May 28, 2025•12

3D医用画像のためのスケーラブルな言語-画像事前学習に向けて
Towards Scalable Language-Image Pre-training for 3D Medical Imaging

Chenhui Zhao, Yiwei Lyu, Asadur Chowdury, Edward Harake, Akhil Kondepudi, Akshay Rao, Xinhai Hou, Honglak Lee, Todd Hollon•May 28, 2025•12

大規模言語モデルは実世界のテキストから因果関係を推論できるか?
Can Large Language Models Infer Causal Relationships from Real-World Text?

Ryan Saklad, Aman Chadha, Oleg Pavlov, Raha Moraffah•May 25, 2025•12

ファーストフィニッシュサーチ:大規模言語モデルにおける効率的なテスト時スケーリング
First Finish Search: Efficient Test-Time Scaling in Large Language Models

Aradhye Agarwal, Ayan Sengupta, Tanmoy Chakraborty•May 23, 2025•12

IQBench: 視覚-言語モデルはどれほど「賢い」のか?人間のIQテストを用いた研究
IQBench: How "Smart'' Are Vision-Language Models? A Study with Human IQ Tests

Tan-Hanh Pham, Phu-Vinh Nguyen, Dang The Hung, Bui Trong Duong, Vu Nguyen Thanh, Chris Ngo, Tri Quang Truong, Truong-Son Hy•May 17, 2025•02