ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
March 4th, 2025
CodeArena: LLMコード生成のための集団評価プラットフォーム
CodeArena: A Collective Evaluation Platform for LLM Code Generation
Mingzhe Du, Anh Tuan Luu, Bin Ji, Xiaobao Wu, Dong Huang, Terry Yue Zhuo, Qian Liu, See-Kiong Ng
•
Mar 3, 2025
•
8
2
自己改善する推論者を可能にする認知的振る舞い、あるいは、高度に効果的なSTaRの4つの習慣
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs
Kanishk Gandhi, Ayush Chakravarthy, Anikait Singh, Nathan Lile, Noah D. Goodman
•
Mar 3, 2025
•
38
3
OneRec: 生成型レコメンダーと反復的選好アラインメントによる検索とランキングの統合
OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment
Jiaxin Deng, Shiyao Wang, Kuo Cai, Lejian Ren, Qigen Hu, Weifeng Ding, Qiang Luo, Guorui Zhou
•
Feb 26, 2025
•
25
2
VideoUFO: テキストからビデオ生成のための大規模ユーザー中心データセット
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation
Wenhao Wang, Yi Yang
•
Mar 3, 2025
•
8
2
AIが発明した音調言語:人間の理解を超えた機械共通語の防止
AI-Invented Tonal Languages: Preventing a Machine Lingua Franca Beyond Human Understanding
David Noever
•
Mar 2, 2025
•
5
2
Qilin: アプリケーションレベルのユーザーセッションを備えたマルチモーダル情報検索データセット
Qilin: A Multimodal Information Retrieval Dataset with APP-level User Sessions
Jia Chen, Qian Dong, Haitao Li, Xiaohui He, Yan Gao, Shaosheng Cao, Yi Wu, Ping Yang, Chen Xu, Yao Hu, Qingyao Ai, Yiqun Liu
•
Mar 1, 2025
•
12
2
事前学習モデル時代における非ポーズ・疎ビューからの室内レイアウト再構築
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model
Yaxuan Huang, Xili Dai, Jianan Wang, Xianbiao Qi, Yixing Yuan, Xiangyu Yue
•
Feb 24, 2025
•
3
2
大規模データ選択による指示チューニング
Large-Scale Data Selection for Instruction Tuning
Hamish Ivison, Muru Zhang, Faeze Brahman, Pang Wei Koh, Pradeep Dasigi
•
Mar 3, 2025
•
12
2
DiffRhythm: 驚異的な速度と驚くほどシンプルなエンドツーエンドのフルレングス楽曲生成を実現する潜在拡散モデル
DiffRhythm: Blazingly Fast and Embarrassingly Simple End-to-End Full-Length Song Generation with Latent Diffusion
Ziqian Ning, Huakang Chen, Yuepeng Jiang, Chunbo Hao, Guobin Ma, Shuai Wang, Jixun Yao, Lei Xie
•
Mar 3, 2025
•
27
2
DuoDecoding:ハードウェアを考慮した異種推測デコーディングと動的マルチシーケンスドラフト生成
DuoDecoding: Hardware-aware Heterogeneous Speculative Decoding with Dynamic Multi-Sequence Drafting
Kai Lv, Honglin Guo, Qipeng Guo, Xipeng Qiu
•
Mar 2, 2025
•
13
2
単語形態の重要性:タイポグリセミア下におけるLLMの意味再構築
Word Form Matters: LLMs' Semantic Reconstruction under Typoglycemia
Chenxi Wang, Tianle Gu, Zhongyu Wei, Lang Gao, Zirui Song, Xiuying Chen
•
Mar 3, 2025
•
5
2
自己回帰型マルチモーダル基盤モデルに対するメトリック距離の指導
Teaching Metric Distance to Autoregressive Multimodal Foundational Models
Jiwan Chung, Saejin Kim, Yongrae Jo, Jaewoo Park, Dongjun Min, Youngjae Yu
•
Mar 4, 2025
•
4
2
Phi-4-Mini技術レポート:Mixture-of-LoRAsによるコンパクトで強力なマルチモーダル言語モデル
Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs
Abdelrahman Abouelenin, Atabak Ashfaq, Adam Atkinson, Hany Awadalla, Nguyen Bach, Jianmin Bao, Alon Benhaim, Martin Cai, Vishrav Chaudhary, Congcong Chen, Dong Chen, Dongdong Chen, Junkun Chen, Weizhu Chen, Yen-Chun Chen, Yi-ling Chen, Qi Dai, Xiyang Dai, Ruchao Fan, Mei Gao, Min Gao, Amit Garg, Abhishek Goswami, Junheng Hao, Amr Hendy, Yuxuan Hu, Xin Jin, Mahmoud Khademi, Dongwoo Kim, Young Jin Kim, Gina Lee, Jinyu Li, Yunsheng Li, Chen Liang, Xihui Lin, Zeqi Lin, Mengchen Liu, Yang Liu, Gilsinia Lopez, Chong Luo, Piyush Madan, Vadim Mazalov, Ali Mousavi, Anh Nguyen, Jing Pan, Daniel Perez-Becker, Jacob Platin, Thomas Portet, Kai Qiu, Bo Ren, Liliang Ren, Sambuddha Roy, Ning Shang, Yelong Shen, Saksham Singhal, Subhojit Som, Xia Song, Tetyana Sych, Praneetha Vaddamanu, Shuohang Wang, Yiming Wang, Zhenghao Wang, Haibin Wu, Haoran Xu, Weijian Xu, Yifan Yang, Ziyi Yang, Donghan Yu, Ishmam Zabir, Jianwen Zhang, Li Lyna Zhang, Yunan Zhang, Xiren Zhou
•
Mar 3, 2025
•
86
6
なぜWeb AIエージェントはスタンドアロンLLMよりも脆弱なのか?セキュリティ分析
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis
Jeffrey Yang Fan Chiang, Seungjae Lee, Jia-Bin Huang, Furong Huang, Yizheng Chen
•
Feb 27, 2025
•
3
2
Visual-RFT: 視覚的強化学習によるファインチューニング
Visual-RFT: Visual Reinforcement Fine-Tuning
Ziyu Liu, Zeyi Sun, Yuhang Zang, Xiaoyi Dong, Yuhang Cao, Haodong Duan, Dahua Lin, Jiaqi Wang
•
Mar 3, 2025
•
78
2
効率的なテスト時スケーリングのための自己較正
Efficient Test-Time Scaling via Self-Calibration
Chengsong Huang, Langlin Huang, Jixuan Leng, Jiacheng Liu, Jiaxin Huang
•
Feb 25, 2025
•
15
2
Kiss3DGen: 画像拡散モデルを3Dアセット生成に転用する
Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation
Jiantao Lin, Xin Yang, Meixi Chen, Yingjie Xu, Dongyu Yan, Leyi Wu, Xinli Xu, Lie XU, Shunsi Zhang, Ying-Cong Chen
•
Mar 3, 2025
•
15
2
SampleMix: データ品質と多様性を調整するサンプル単位の事前学習データ混合戦略
SampleMix: A Sample-wise Pre-training Data Mixing Strategey by Coordinating Data Quality and Diversity
Xiangyu Xi, Deyang Kong, Jian Yang, Jiawei Yang, Zhengyu Chen, Wei Wang, Jingang Wang, Xunliang Cai, Shikun Zhang, Wei Ye
•
Mar 3, 2025
•
9
2
投機的アドホッククエリ
Speculative Ad-hoc Querying
Haoyu Li, Srikanth Kandula, Maria Angels de Luis Balaguer, Aditya Akella, Venkat Arun
•
Mar 2, 2025
•
13
2
一般的な推論能力を獲得するには、最初から推論を学ぶ必要がある
General Reasoning Requires Learning to Reason from the Get-go
Seungwook Han, Jyothish Pari, Samuel J. Gershman, Pulkit Agrawal
•
Feb 26, 2025
•
5
2
CLEA:動的環境におけるタスク実行を強化するための閉ループ型エンボディエージェント
CLEA: Closed-Loop Embodied Agent for Enhancing Task Execution in Dynamic Environments
Mingcong Lei, Ge Wang, Yiming Zhao, Zhixin Mai, Qing Zhao, Yao Guo, Zhen Li, Shuguang Cui, Yatong Han, Jinke Ren
•
Mar 2, 2025
•
3
2
数時間から数分へ:最大10万トークンの超長シーケンス生成をロスレスで高速化
From Hours to Minutes: Lossless Acceleration of Ultra Long Sequence Generation up to 100K Tokens
Tong Wu, Junzhe Shen, Zixia Jia, Yuxuan Wang, Zilong Zheng
•
Feb 26, 2025
•
30
2
LLMが自身の回答に対して不安を感じている場合、そしてその不確実性が正当である場合
When an LLM is apprehensive about its answers -- and when its uncertainty is justified
Petr Sychev, Andrey Goncharov, Daniil Vyazhev, Edvard Khalafyan, Alexey Zaytsev
•
Mar 3, 2025
•
21
2
Liger: 大規模言語モデルの線形化とゲート付きリカレント構造への変換
Liger: Linearizing Large Language Models to Gated Recurrent Structures
Disen Lan, Weigao Sun, Jiaxi Hu, Jusen Du, Yu Cheng
•
Mar 3, 2025
•
18
2
Difix3D+: シングルステップ拡散モデルによる3D再構成の改善
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models
Jay Zhangjie Wu, Yuxuan Zhang, Haithem Turki, Xuanchi Ren, Jun Gao, Mike Zheng Shou, Sanja Fidler, Zan Gojcic, Huan Ling
•
Mar 3, 2025
•
44
2
RSQ:重要なトークンから学習することで、より優れた量子化LLMを実現
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs
Yi-Lin Sung, Prateek Yadav, Jialu Li, Jaehong Yoon, Mohit Bansal
•
Mar 3, 2025
•
2
3
直接識別最適化:尤度ベースの視覚生成モデルは実はGANの識別器だった
Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator
Kaiwen Zheng, Yongxin Chen, Huayu Chen, Guande He, Ming-Yu Liu, Jun Zhu, Qinsheng Zhang
•
Mar 3, 2025
•
3
2
PodAgent: ポッドキャスト生成のための包括的フレームワーク
PodAgent: A Comprehensive Framework for Podcast Generation
Yujia Xiao, Lei He, Haohan Guo, Fenglong Xie, Tan Lee
•
Mar 1, 2025
•
6
2