日刊論文
「アハ!」を超えて:大規模推論モデルにおける体系的なメタ能力アラインメントに向けてBeyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
「アハ!」を超えて:大規模推論モデルにおける体系的なメタ能力アラインメントに向けて
Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large
Reasoning Models
Zhiyuan Hu, Yibo Wang, Hanze Dong, Yuhui Xu, Amrita Saha, Caiming Xiong, Bryan Hooi, Junnan Li•May 15, 2025•973
言語モデルの並列スケーリング則Parallel Scaling Law for Language Models
言語モデルの並列スケーリング則
Parallel Scaling Law for Language Models
Mouxiang Chen, Binyuan Hui, Zeyu Cui, Jiaxi Yang, Dayiheng Liu, Jianling Sun, Junyang Lin, Zhongxin Liu•May 15, 2025•533
メタ学習を用いたシステムプロンプト最適化System Prompt Optimization with Meta-Learning
メタ学習を用いたシステムプロンプト最適化
System Prompt Optimization with Meta-Learning
Yumin Choi, Jinheon Baek, Sung Ju Hwang•May 14, 2025•533
OpenThinkIMG: 視覚ツールを用いた強化学習による画像思考の学習OpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
OpenThinkIMG: 視覚ツールを用いた強化学習による画像思考の学習
OpenThinkIMG: Learning to Think with Images via Visual Tool
Reinforcement Learning
Zhaochen Su, Linjie Li, Mingyang Song, Yunzhuo Hao, Zhengyuan Yang, Jun Zhang, Guanjie Chen, Jiawei Gu, Juntao Li, Xiaoye Qu, Yu Cheng•May 13, 2025•293
EnerVerse-AC: アクション条件付きで具現化された環境を構想するEnerVerse-AC: Envisioning Embodied Environments with Action Condition
EnerVerse-AC: アクション条件付きで具現化された環境を構想する
EnerVerse-AC: Envisioning Embodied Environments with Action Condition
Yuxin Jiang, Shengcong Chen, Siyuan Huang, Liliang Chen, Pengfei Zhou, Yue Liao, Xindong He, Chiming Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren•May 14, 2025•182
エンドツーエンド視覚トークナイザーチューニングEnd-to-End Vision Tokenizer Tuning
エンドツーエンド視覚トークナイザーチューニング
End-to-End Vision Tokenizer Tuning
Wenxuan Wang, Fan Zhang, Yufeng Cui, Haiwen Diao, Zhuoyan Luo, Huchuan Lu, Jing Liu, Xinlong Wang•May 15, 2025•173
WorldPM: 人間の選好モデリングのスケーリングWorldPM: Scaling Human Preference Modeling
WorldPM: 人間の選好モデリングのスケーリング
WorldPM: Scaling Human Preference Modeling
Binghai Wang, Runji Lin, Keming Lu, Le Yu, Zhenru Zhang, Fei Huang, Chujie Zheng, Kai Dang, Yang Fan, Xingzhang Ren, An Yang, Binyuan Hui, Dayiheng Liu, Tao Gui, Qi Zhang, Xuanjing Huang, Yu-Gang Jiang, Bowen Yu, Jingren Zhou, Junyang Lin•May 15, 2025•172
CoT百科:推論モデルの思考を分析、予測、制御する方法The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
CoT百科:推論モデルの思考を分析、予測、制御する方法
The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a
Reasoning Model will Think
Seongyun Lee, Seungone Kim, Minju Seo, Yongrae Jo, Dongyoung Go, Hyeonbin Hwang, Jinho Park, Xiang Yue, Sean Welleck, Graham Neubig, Moontae Lee, Minjoon Seo•May 15, 2025•172
J1: 強化学習によるLLM-as-a-Judgeにおける思考の促進J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
J1: 強化学習によるLLM-as-a-Judgeにおける思考の促進
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
Chenxi Whitehouse, Tianlu Wang, Ping Yu, Xian Li, Jason Weston, Ilia Kulikov, Swarnadeep Saha•May 15, 2025•152
EWMBench: エンボディド・ワールドモデルにおけるシーン、モーション、セマンティック品質の評価EWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
EWMBench: エンボディド・ワールドモデルにおけるシーン、モーション、セマンティック品質の評価
EWMBench: Evaluating Scene, Motion, and Semantic Quality in Embodied
World Models
Hu Yue, Siyuan Huang, Yue Liao, Shengcong Chen, Pengfei Zhou, Liliang Chen, Maoqing Yao, Guanghui Ren•May 14, 2025•152
MLE-Dojo: 機械学習エンジニアリングにおけるLLMエージェントを強化するためのインタラクティブ環境MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
MLE-Dojo: 機械学習エンジニアリングにおけるLLMエージェントを強化するためのインタラクティブ環境
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine
Learning Engineering
Rushi Qiang, Yuchen Zhuang, Yinghao Li, Dingu Sagar V K, Rongzhi Zhang, Changhao Li, Ian Shu-Hei Wong, Sherry Yang, Percy Liang, Chao Zhang, Bo Dai•May 12, 2025•152
Unilogit: 均一ターゲット自己蒸留を用いた大規模言語モデルのための堅牢な機械的忘却Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Unilogit: 均一ターゲット自己蒸留を用いた大規模言語モデルのための堅牢な機械的忘却
Unilogit: Robust Machine Unlearning for LLMs Using Uniform-Target
Self-Distillation
Stefan Vasilev, Christian Herold, Baohao Liao, Seyyed Hadi Hashemi, Shahram Khadivi, Christof Monz•May 9, 2025•152
画像拡散モデルを活用したテキストからベクトル生成のスタイルカスタマイズStyle Customization of Text-to-Vector Generation with Image Diffusion
Priors
画像拡散モデルを活用したテキストからベクトル生成のスタイルカスタマイズ
Style Customization of Text-to-Vector Generation with Image Diffusion
Priors
Peiying Zhang, Nanxuan Zhao, Jing Liao•May 15, 2025•133
任意の事前知識を伴うDepth AnythingDepth Anything with Any Prior
任意の事前知識を伴うDepth Anything
Depth Anything with Any Prior
Zehan Wang, Siyu Chen, Lihe Yang, Jialei Wang, Ziang Zhang, Hengshuang Zhao, Zhou Zhao•May 15, 2025•112
PointArena: 言語誘導型ポインティングによるマルチモーダルグラウンディングの探求PointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
PointArena: 言語誘導型ポインティングによるマルチモーダルグラウンディングの探求
PointArena: Probing Multimodal Grounding Through Language-Guided
Pointing
Long Cheng, Jiafei Duan, Yi Ru Wang, Haoquan Fang, Boyang Li, Yushan Huang, Elvis Wang, Ainaz Eftekhar, Jason Lee, Wentao Yuan, Rose Hendrix, Noah A. Smith, Fei Xia, Dieter Fox, Ranjay Krishna•May 15, 2025•112
大規模言語モデルと拡散トランスフォーマーの深層融合を探る
―テキストから画像生成への応用―Exploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
大規模言語モデルと拡散トランスフォーマーの深層融合を探る
―テキストから画像生成への応用―
Exploring the Deep Fusion of Large Language Models and Diffusion
Transformers for Text-to-Image Synthesis
Bingda Tang, Boyang Zheng, Xichen Pan, Sayak Paul, Saining Xie•May 15, 2025•102
ヒューリスティック適応とスーパートークン学習による言語モデルのトークナイザ柔軟性の実現Achieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
ヒューリスティック適応とスーパートークン学習による言語モデルのトークナイザ柔軟性の実現
Achieving Tokenizer Flexibility in Language Models through Heuristic
Adaptation and Supertoken Learning
Shaurya Sharthak, Vinayak Pahalwan, Adithya Kamath, Adarsh Shirawalmath•May 14, 2025•92
3D-Fixup: 3D事前情報を用いた写真編集の進展3D-Fixup: Advancing Photo Editing with 3D Priors
3D-Fixup: 3D事前情報を用いた写真編集の進展
3D-Fixup: Advancing Photo Editing with 3D Priors
Yen-Chi Cheng, Krishna Kumar Singh, Jae Shin Yoon, Alex Schwing, Liangyan Gui, Matheus Gadelha, Paul Guerrero, Nanxuan Zhao•May 15, 2025•82
AIエージェント vs エージェンシックAI:概念的分類、応用、そして課題AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
AIエージェント vs エージェンシックAI:概念的分類、応用、そして課題
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and
Challenge
Ranjan Sapkota, Konstantinos I. Roumeliotis, Manoj Karkee•May 15, 2025•72
ReSurgSAM2:信頼性の高い長期追跡による手術動画内の任意領域参照ReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
ReSurgSAM2:信頼性の高い長期追跡による手術動画内の任意領域参照
ReSurgSAM2: Referring Segment Anything in Surgical Video via Credible
Long-term Tracking
Haofeng Liu, Mingqi Gao, Xuxiao Luo, Ziyue Wang, Guanyi Qin, Junde Wu, Yueming Jin•May 13, 2025•72
QuXAI: ハイブリッド量子機械学習モデルのための説明機能QuXAI: Explainers for Hybrid Quantum Machine Learning Models
QuXAI: ハイブリッド量子機械学習モデルのための説明機能
QuXAI: Explainers for Hybrid Quantum Machine Learning Models
Saikat Barua, Mostafizur Rahman, Shehenaz Khaled, Md Jafor Sadek, Rafiul Islam, Shahnewaz Siddique•May 15, 2025•53
AdaptCLIP: ユニバーサル視覚異常検出のためのCLIP適応AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
AdaptCLIP: ユニバーサル視覚異常検出のためのCLIP適応
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection
Bin-Bin Gao, Yue Zhu, Jiangtao Yan, Yuezhi Cai, Weixi Zhang, Meng Wang, Jun Liu, Yong Liu, Lei Wang, Chengjie Wang•May 15, 2025•54
Real2Render2Real: ダイナミクスシミュレーションやロボットハードウェアを必要としないロボットデータのスケーリングReal2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Real2Render2Real: ダイナミクスシミュレーションやロボットハードウェアを必要としないロボットデータのスケーリング
Real2Render2Real: Scaling Robot Data Without Dynamics Simulation or
Robot Hardware
Justin Yu, Letian Fu, Huang Huang, Karim El-Refai, Rares Andrei Ambrus, Richard Cheng, Muhammad Zubair Irshad, Ken Goldberg•May 14, 2025•42
MetaUAS: ワンショットメタ学習によるユニバーサル異常セグメンテーションMetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning
MetaUAS: ワンショットメタ学習によるユニバーサル異常セグメンテーション
MetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning
Bin-Bin Gao•May 14, 2025•42
正常画像1枚だけで多クラス異常を検出する学習
プロンプトLearning to Detect Multi-class Anomalies with Just One Normal Image
Prompt
正常画像1枚だけで多クラス異常を検出する学習
プロンプト
Learning to Detect Multi-class Anomalies with Just One Normal Image
Prompt
Bin-Bin Gao•May 14, 2025•42
少数ショット異常駆動生成による異常分類とセグメンテーションFew-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
少数ショット異常駆動生成による異常分類とセグメンテーション
Few-Shot Anomaly-Driven Generation for Anomaly Classification and
Segmentation
Guan Gui, Bin-Bin Gao, Jun Liu, Chengjie Wang, Yunsheng Wu•May 14, 2025•42
X-Sim: 実世界からシミュレーションを経て実世界へ至るクロスエンボディメント学習X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
X-Sim: 実世界からシミュレーションを経て実世界へ至るクロスエンボディメント学習
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real
Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury•May 11, 2025•32