AI研究論文デイリー

翻訳付きの日次キュレーションされたAI研究論文

大規模言語モデル（LLM）の熟慮的推論能力を評価・改善するためのリフレクティブパズル解決手法FINEREASON Abstract 大規模言語モデル（LLM）は、複雑な推論タスクにおいて驚くべき能力を発揮しているが、熟慮的で体系的な推論プロセスを実行する能力には依然として課題がある。本論文では、LLMの熟慮的推論能力を評価・改善するための新しいアプローチであるFINEREASONを提案する。FINEREASONは、LLMがパズルを解決する際に、自身の推論プロセスを振り返り、誤りを特定し、修正する能力を促進するリフレクティブ推論フレームワークを提供する。我々は、複数のLLMに対してFINEREASONを適用し、その有効性を実証する。実験結果は、FINEREASONがLLMの推論精度を大幅に向上させ、より体系的な推論プロセスを実現することを示している。さらに、FINEREASONはLLMの推論プロセスを透明化し、その内部動作を理解するための貴重な洞察を提供する。本論文は、LLMの推論能力を向上させる新たな方向性を示すとともに、人間とAIの協調的な問題解決に向けた重要な一歩を踏み出すものである。
FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving

Guizhen Chen, Weiwen Xu, Hao Zhang, Hou Pong Chan, Chaoqun Liu, Lidong Bing, Deli Zhao, Anh Tuan Luu, Yu Rong•Feb 27, 2025•242

UniTok: 視覚生成と理解のための統一トークナイザー
UniTok: A Unified Tokenizer for Visual Generation and Understanding

Chuofan Ma, Yi Jiang, Junfeng Wu, Jihan Yang, Xin Yu, Zehuan Yuan, Bingyue Peng, Xiaojuan Qi•Feb 27, 2025•302

変分ノイズ結合を用いた一貫性モデルのトレーニング
Training Consistency Models with Variational Noise Coupling

Gianluigi Silvestri, Luca Ambrogioni, Chieh-Hsin Lai, Yuhta Takida, Yuki Mitsufuji•Feb 25, 2025•72

CODESYNC: 大規模言語モデルと動的コード進化のスケーラブルな同期
CODESYNC: Synchronizing Large Language Models with Dynamic Code Evolution at Scale

Chenlong Wang, Zhaoyang Chu, Zhengxiang Cheng, Xuyi Yang, Kaiyue Qiu, Yao Wan, Zhou Zhao, Xuanhua Shi, Dongping Chen•Feb 23, 2025•222

モノクル動的シーンレンダリングのための効率的なガウススプラッティングによる、疎な時間変動属性モデリング
Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling

Hanyang Kong, Xingyi Yang, Xinchao Wang•Feb 27, 2025•42

大規模言語モデルにおける関係特異ニューロンについて
On Relation-Specific Neurons in Large Language Models

Yihong Liu, Runsheng Chen, Lea Hirlimann, Ahmad Dawar Hakimi, Mingyang Wang, Amir Hossein Kargaran, Sascha Rothe, François Yvon, Hinrich Schütze•Feb 24, 2025•72

Mobius: 潜在空間シフトによるテキストからシームレスループ動画生成
Mobius: Text to Seamless Looping Video Generation via Latent Shift

Xiuli Bi, Jianfei Yuan, Bo Liu, Yong Zhang, Xiaodong Cun, Chi-Man Pun, Bin Xiao•Feb 27, 2025•192

画像生成のためのマルチモーダル表現整列：テキスト-画像相互制御は思っているよりも簡単です
Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think

Liang Chen, Shuai Bai, Wenhao Chai, Weichu Xie, Haozhe Zhao, Leon Vinci, Junyang Lin, Baobao Chang•Feb 27, 2025•283

NeoBERT: 次世代BERT
NeoBERT: A Next-Generation BERT

Lola Le Breton, Quentin Fournier, Mariam El Mezouar, Sarath Chandar•Feb 26, 2025•396

SoRFT: サブタスク指向の強化学習によるファインチューニングを用いた課題解決
SoRFT: Issue Resolving with Subtask-oriented Reinforced Fine-Tuning

Zexiong Ma, Chao Peng, Pengfei Gao, Xiangxin Meng, Yanzhen Zou, Bing Xie•Feb 27, 2025•92

エージェントシステムの守護者：エージェントシステムによる多数のショットジェイルブレイクの防止
Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System

Saikat Barua, Mostafizur Rahman, Md Jafor Sadek, Rafiul Islam, Shehnaz Khaled, Ahmedul Kabir•Feb 23, 2025•102

MedVLM-R1: 強化学習を通じてビジョン言語モデル（VLM）の医療推論能力を奨励する
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning

Jiazhen Pan, Che Liu, Junde Wu, Fenglin Liu, Jiayuan Zhu, Hongwei Bran Li, Chen Chen, Cheng Ouyang, Daniel Rueckert•Feb 26, 2025•633

LongRoPE2: ほぼロスレスなLLMコンテキストウィンドウの拡張
LongRoPE2: Near-Lossless LLM Context Window Scaling

Ning Shang, Li Lyna Zhang, Siyuan Wang, Gaokai Zhang, Gilsinia Lopez, Fan Yang, Weizhu Chen, Mao Yang•Feb 27, 2025•382

R2-T2：マルチモーダルMixture-of-Expertsにおけるテストタイム再ルーティング
R2-T2: Re-Routing in Test-Time for Multimodal Mixture-of-Experts

Zhongyang Li, Ziyue Li, Tianyi Zhou•Feb 27, 2025•475

数学的推論における自己報酬型修正
Self-rewarding correction for mathematical reasoning

Wei Xiong, Hanning Zhang, Chenlu Ye, Lichang Chen, Nan Jiang, Tong Zhang•Feb 26, 2025•846

R1-T1: 推論学習によるLLMの翻訳能力の完全なインセンティブ設計
R1-T1: Fully Incentivizing Translation Capability in LLMs via Reasoning Learning

Minggui He, Yilun Liu, Shimin Tao, Yuanchang Luo, Hongyong Zeng, Chang Su, Li Zhang, Hongxia Ma, Daimeng Wei, Weibin Meng, Hao Yang, Boxing Chen, Osamu Yoshie•Feb 27, 2025•92

複雑な関節を持つ物体の対話可能なレプリカの構築に関する、ガウススプラッティングを用いた方法
Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting

Yu Liu, Baoxiong Jia, Ruijie Lu, Junfeng Ni, Song-Chun Zhu, Siyuan Huang•Feb 26, 2025•112

FlexiDiT：あなたのDiffusion Transformerは、少ない計算量で高品質なサンプルを簡単に生成できます
FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute

Sotiris Anagnostidis, Gregor Bachmann, Yeongmin Kim, Jonas Kohler, Markos Georgopoulos, Artsiom Sanakoyeu, Yuming Du, Albert Pumarola, Ali Thabet, Edgar Schönfeld•Feb 27, 2025•202

PlanGEN: 複雑な問題解決のための計画と推論の軌跡を生成するためのマルチエージェントフレームワーク
PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving

Mihir Parmar, Xin Liu, Palash Goyal, Yanfei Chen, Long Le, Swaroop Mishra, Hossein Mobahi, Jindong Gu, Zifeng Wang, Hootan Nakhost, Chitta Baral, Chen-Yu Lee, Tomas Pfister, Hamid Palangi•Feb 22, 2025•95

リーン・アンド・ミーン：グローバル価値ガイダンスを用いた分離型価値政策最適化
Lean and Mean: Decoupled Value Policy Optimization with Global Value Guidance

Chenghua Huang, Lu Wang, Fangkai Yang, Pu Zhao, Zhixu Li, Qingwei Lin, Dongmei Zhang, Saravan Rajmohan, Qi Zhang•Feb 24, 2025•102

次のトークンを超えて：自己回帰的なビジュアル生成のための次のX予測
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation

Sucheng Ren, Qihang Yu, Ju He, Xiaohui Shen, Alan Yuille, Liang-Chieh Chen•Feb 27, 2025•162