ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
March 13th, 2025
RewardSDS: 報酬重み付きサンプリングによるスコア蒸留のアラインメント
RewardSDS: Aligning Score Distillation via Reward-Weighted Sampling
Itay Chachy, Guy Yariv, Sagie Benaim
•
Mar 12, 2025
•
15
2
GTR: ガイド付き思考強化によるRLベースVLMエージェント訓練における思考崩壊の防止
GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training
Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye
•
Mar 11, 2025
•
17
2
コード生成のための大規模言語モデルの量子化:差別化された再現
Quantizing Large Language Models for Code Generation: A Differentiated Replication
Alessandro Giagnorio, Antonio Mastropaolo, Saima Afrin, Massimiliano Di Penta, Gabriele Bavota
•
Mar 10, 2025
•
8
2
MoC: 検索拡張生成システムのためのテキストチャンキング学習器の混合モデル
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System
Jihao Zhao, Zhiyuan Ji, Zhaoxin Fan, Hanyu Wang, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Mar 12, 2025
•
4
3
PhysicsGen: 生成モデルは画像から複雑な物理的関係を予測することを学習できるか?
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations?
Martin Spitznagel, Jan Vaillant, Janis Keuper
•
Mar 7, 2025
•
8
2
より多くの文書、同じ長さ:RAGにおける複数文書の課題の分離
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG
Shahar Levy, Nir Mazor, Lihi Shalmon, Michael Hassid, Gabriel Stanovsky
•
Mar 6, 2025
•
16
3
モーション・エニシング:任意からモーション生成へ
Motion Anything: Any to Motion Generation
Zeyu Zhang, Yiran Wang, Wei Mao, Danning Li, Rui Zhao, Biao Wu, Zirui Song, Bohan Zhuang, Ian Reid, Richard Hartley
•
Mar 10, 2025
•
32
6
VLog: ナレーションの生成的検索によるビデオ-言語モデル 語彙
VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary
Kevin Qinghong Lin, Mike Zheng Shou
•
Mar 12, 2025
•
7
2
長文脈LLMのためのコスト最適化グループ化クエリアテンション
Cost-Optimal Grouped-Query Attention for Long-Context LLMs
Yingfa Chen, Yutong Wu, Xu Han, Zhiyuan Liu, Maosong Sun
•
Mar 12, 2025
•
5
2
一般化可能な学習ベースRANSACのためのモンテカルロ拡散法
Monte Carlo Diffusion for Generalizable Learning-Based RANSAC
Jiale Wang, Chen Zhao, Wei Ke, Tong Zhang
•
Mar 12, 2025
•
1
2
ブロック拡散:自己回帰モデルと拡散言語モデルの間の補間
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models
Marianne Arriola, Aaron Gokaslan, Justin T Chiu, Zhihan Yang, Zhixuan Qi, Jiaqi Han, Subham Sekhar Sahoo, Volodymyr Kuleshov
•
Mar 12, 2025
•
71
3
WildIFEval:実世界における指示追従評価
WildIFEval: Instruction Following in the Wild
Gili Lior, Asaf Yehudai, Ariel Gera, Liat Ein-Dor
•
Mar 9, 2025
•
13
4
BIMBA: 長距離ビデオ質問応答のための選択的スキャン圧縮
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering
Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani
•
Mar 12, 2025
•
3
2
機械学習のための分布シフトの理解と緩和 フォースフィールド
Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields
Tobias Kreiman, Aditi S. Krishnapriyan
•
Mar 11, 2025
•
0
3
エッジデバイス向けマルチエージェント医療アシスタント
Multi Agent based Medical Assistant for Edge Devices
Sakharam Gawade, Shivam Akhouri, Chinmay Kulkarni, Jagdish Samant, Pragya Sahu, Aastik, Jai Pahal, Saswat Meher
•
Mar 7, 2025
•
7
2
エイリアスフリー潜在拡散モデル:拡散潜在空間の分数シフト等価性の改善
Alias-Free Latent Diffusion Models:Improving Fractional Shift Equivariance of Diffusion Latent Space
Yifan Zhou, Zeqi Xiao, Shuai Yang, Xingang Pan
•
Mar 12, 2025
•
6
2
Search-R1: 強化学習を用いて大規模言語モデルに推論と検索エンジンの活用を訓練する
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han
•
Mar 12, 2025
•
28
2
大規模視覚言語モデルが大規模リモートセンシング画像に出会うとき: テキスト誘導型トークンプルーニングの粗から細へのアプローチ
When Large Vision-Language Model Meets Large Remote Sensing Imagery: Coarse-to-Fine Text-Guided Token Pruning
Junwei Luo, Yingying Zhang, Xue Yang, Kang Wu, Qi Zhu, Lei Liang, Jingdong Chen, Yansheng Li
•
Mar 10, 2025
•
7
3
高精度単細胞トランスクリプトミクス解析と生成のためのマルチモーダル言語モデリング
Multimodal Language Modeling for High-Accuracy Single Cell Transcriptomics Analysis and Generation
Yaorui Shi, Jiaqi Yang, Sihang Li, Junfeng Fang, Xiang Wang, Zhiyuan Liu, Yang Zhang
•
Mar 12, 2025
•
4
2
自己学習型自己修正による小型言語モデルの改善
Self-Taught Self-Correction for Small Language Models
Viktor Moskvoretskii, Chris Biemann, Irina Nikishina
•
Mar 11, 2025
•
15
2
TPDiff:時間ピラミッド型ビデオ拡散モデル
TPDiff: Temporal Pyramid Video Diffusion Model
Lingmin Ran, Mike Zheng Shou
•
Mar 12, 2025
•
45
3
Reangle-A-Video: 4Dビデオ生成をビデオ間翻訳として実現
Reangle-A-Video: 4D Video Generation as Video-to-Video Translation
Hyeonho Jeong, Suhyeon Lee, Jong Chul Ye
•
Mar 12, 2025
•
32
2