ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
October 8th, 2024
SwiftKV: 知識保存モデル変換を用いた高速プリフィル最適化推論
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation
Aurick Qiao, Zhewei Yao, Samyam Rajbhandari, Yuxiong He
•
Oct 4, 2024
•
2
2
画像分類のためのデータキュレーション戦略の大規模ベンチマーク:SELECT
SELECT: A Large-Scale Benchmark of Data Curation Strategies for Image Classification
Benjamin Feuer, Jiawei Xu, Niv Cohen, Patrick Yubeaton, Govind Mittal, Chinmay Hegde
•
Oct 7, 2024
•
7
2
人間と同様にデジタル世界をナビゲートする:GUI エージェントのための普遍的なビジュアルグラウンディング
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents
Boyu Gou, Ruohan Wang, Boyuan Zheng, Yanan Xie, Cheng Chang, Yiheng Shu, Huan Sun, Yu Su
•
Oct 7, 2024
•
19
2
MathHay: LLMにおける長文脈数学推論のための自動ベンチマーク
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs
Lei Wang, Shan Dong, Yuhui Xu, Hanze Dong, Yalu Wang, Amrita Saha, Ee-Peng Lim, Caiming Xiong, Doyen Sahoo
•
Oct 7, 2024
•
13
3
プレスト!音楽生成を加速するためのステップとレイヤーの蒸留
Presto! Distilling Steps and Layers for Accelerating Music Generation
Zachary Novack, Ge Zhu, Jonah Casebeer, Julian McAuley, Taylor Berg-Kirkpatrick, Nicholas J. Bryan
•
Oct 7, 2024
•
18
4
LLaMA-Berry:O1のようなオリンピアードレベルの数学的推論のためのペアワイズ最適化
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning
Di Zhang, Jianbo Wu, Jingdi Lei, Tong Che, Jiatong Li, Tong Xie, Xiaoshui Huang, Shufei Zhang, Marco Pavone, Yuqiang Li, Wanli Ouyang, Dongzhan Zhou
•
Oct 3, 2024
•
55
4
名前付き臨床エンティティ認識ベンチマーク
Named Clinical Entity Recognition Benchmark
Wadood M Abdul, Marco AF Pimentel, Muhammad Umar Salman, Tathagata Raha, Clément Christophe, Praveen K Kanithi, Nasir Hayat, Ronnie Rajan, Shadab Khan
•
Oct 7, 2024
•
17
3
UniMuMo: 統合テキスト、音楽、動作生成
UniMuMo: Unified Text, Music and Motion Generation
Han Yang, Kun Su, Yutong Zhang, Jiaben Chen, Kaizhi Qian, Gaowen Liu, Chuang Gan
•
Oct 6, 2024
•
19
2
テキスト指示からの自律キャラクター・シーンインタラクション合成
Autonomous Character-Scene Interaction Synthesis from Text Instruction
Nan Jiang, Zimo He, Zi Wang, Hongjie Li, Yixin Chen, Siyuan Huang, Yixin Zhu
•
Oct 4, 2024
•
7
2
GSM-Symbolic:大規模言語モデルにおける数理推論の限界の理解
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
Iman Mirzadeh, Keivan Alizadeh, Hooman Shahrokhi, Oncel Tuzel, Samy Bengio, Mehrdad Farajtabar
•
Oct 7, 2024
•
22
6
ScienceAgentBench:データ駆動型科学的発見のための言語エージェントの厳密な評価に向けて
ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery
Ziru Chen, Shijie Chen, Yuting Ning, Qianheng Zhang, Boshi Wang, Botao Yu, Yifei Li, Zeyi Liao, Chen Wei, Zitong Lu, Vishal Dey, Mingyi Xue, Frazier N. Baker, Benjamin Burns, Daniel Adu-Ampratwum, Xuhui Huang, Xia Ning, Song Gao, Yu Su, Huan Sun
•
Oct 7, 2024
•
21
2
要約: 大規模ビジョン言語モデル向けのトークンレベルのディテクティブ報酬モデル
TLDR: Token-Level Detective Reward Model for Large Vision Language Models
Deqing Fu, Tong Xiao, Rui Wang, Wang Zhu, Pengchuan Zhang, Guan Pang, Robin Jia, Lawrence Chen
•
Oct 7, 2024
•
17
2
微分トランスフォーマー
Differential Transformer
Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei
•
Oct 7, 2024
•
178
35
ビデオ拡散における時間モデリングの再定義:ベクトル化されたタイムステップアプローチ
Redefining Temporal Modeling in Video Diffusion: The Vectorized Timestep Approach
Yaofang Liu, Yumeng Ren, Xiaodong Cun, Aitor Artola, Yang Liu, Tieyong Zeng, Raymond H. Chan, Jean-michel Morel
•
Oct 4, 2024
•
5
2
多視点参照コミュニケーションにおける言語の基盤
Grounding Language in Multi-Perspective Referential Communication
Zineng Tang, Lingjun Mao, Alane Suhr
•
Oct 4, 2024
•
4
2
スケールでのモデル統合において重要な要素は何ですか?
What Matters for Model Merging at Scale?
Prateek Yadav, Tu Vu, Jonathan Lai, Alexandra Chronopoulou, Manaal Faruqui, Mohit Bansal, Tsendsuren Munkhdalai
•
Oct 4, 2024
•
8
2
OmniBooth: マルチモーダル指示による画像合成のための潜在制御の学習
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction
Leheng Li, Weichao Qiu, Xu Yan, Jing He, Kaiqiang Zhou, Yingjie Cai, Qing Lian, Bingbing Liu, Ying-Cong Chen
•
Oct 7, 2024
•
9
2
LLMは示す以上に知っている: LLMホールジネーションの固有表現について
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations
Hadas Orgad, Michael Toker, Zorik Gekhman, Roi Reichart, Idan Szpektor, Hadas Kotek, Yonatan Belinkov
•
Oct 3, 2024
•
49
5
FAN: フーリエ解析ネットワーク
FAN: Fourier Analysis Networks
Yihong Dong, Ge Li, Yongding Tao, Xue Jiang, Kechi Zhang, Jia Li, Jing Su, Jun Zhang, Jingjing Xu
•
Oct 3, 2024
•
27
6
MonST3R:運動の存在下での幾何学の推定のためのシンプルなアプローチ
MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion
Junyi Zhang, Charles Herrmann, Junhwa Hur, Varun Jampani, Trevor Darrell, Forrester Cole, Deqing Sun, Ming-Hsuan Yang
•
Oct 4, 2024
•
19
3
ビデオガイド:教師のガイドを通じたトレーニングなしでビデオ拡散モデルを改善する
VideoGuide: Improving Video Diffusion Models without Training Through a Teacher's Guide
Dohun Lee, Bryan S Kim, Geon Yeong Park, Jong Chul Ye
•
Oct 6, 2024
•
30
3
TurtleBench:実世界のYes/Noパズルを通じてトップ言語モデルを評価する
TurtleBench: Evaluating Top Language Models via Real-World Yes/No Puzzles
Qingchen Yu, Shichao Song, Ke Fang, Yunfeng Shi, Zifan Zheng, Hanyu Wang, Simin Niu, Zhiyu Li
•
Oct 7, 2024
•
10
2
SePPO: 拡散整合のための半ポリシー選好最適化
SePPO: Semi-Policy Preference Optimization for Diffusion Alignment
Daoan Zhang, Guangchen Lan, Dong-Jun Han, Wenlin Yao, Xiaoman Pan, Hongming Zhang, Mingxiao Li, Pengcheng Chen, Yu Dong, Christopher Brinton, Jiebo Luo
•
Oct 7, 2024
•
5
2