ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
December 2nd, 2024
GRAPE: 偏好整列を通じたロボットポリシーの一般化
GRAPE: Generalizing Robot Policy via Preference Alignment
Zijian Zhang, Kaiyuan Zheng, Zhaorun Chen, Joel Jang, Yi Li, Chaoqi Wang, Mingyu Ding, Dieter Fox, Huaxiu Yao
•
Nov 28, 2024
•
48
2
ノイズトークンの剪定訓練
Training Noise Token Pruning
Mingxing Rao, Bohan Jiang, Daniel Moyer
•
Nov 27, 2024
•
1
2
MATATA: 表形式アプリケーションのための弱教師付き数学ツール支援推論
MATATA: a weak-supervised MAthematical Tool-Assisted reasoning for Tabular Applications
Vishnou Vinayagame, Gregory Senay, Luis Martí
•
Nov 28, 2024
•
8
2
高度なビデオ拡散サンプリングのための時空間スキップガイダンス
Spatiotemporal Skip Guidance for Enhanced Video Diffusion Sampling
Junha Hyung, Kinam Kim, Susung Hong, Min-Jung Kim, Jaegul Choo
•
Nov 27, 2024
•
24
3
手動で注釈付けされたデータのないテキスト分類のためのLLM教師生徒フレームワーク:IPTCニューストピック分類のケーススタディ
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification
Taja Kuzman, Nikola Ljubešić
•
Nov 29, 2024
•
6
2
例を超えて:MCTSを介したインコンテキスト学習における高レベルの自動推論パラダイム
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
•
Nov 27, 2024
•
38
14
低ビットレート高品質音声符号化のためのTransformerのスケーリング
Scaling Transformers for Low-Bitrate High-Quality Speech Coding
Julian D Parker, Anton Smirnov, Jordi Pons, CJ Carr, Zack Zukowski, Zach Evans, Xubo Liu
•
Nov 29, 2024
•
12
3
SpotLight:拡散を介した影案内オブジェクトの再照明
SpotLight: Shadow-Guided Object Relighting via Diffusion
Frédéric Fortier-Chouinard, Zitian Zhang, Louis-Etienne Messier, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Nov 27, 2024
•
3
1
パズル:推論最適化LLM向けの蒸留ベースNAS
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs
Akhiad Bercovich, Tomer Ronen, Talor Abramovich, Nir Ailon, Nave Assaf, Mohammad Dabbah, Ido Galil, Amnon Geifman, Yonatan Geifman, Izhak Golan, Netanel Haber, Ehud Karpas, Itay Levy, Shahar Mor, Zach Moshe, Najeeb Nabwani, Omri Puny, Ran Rubin, Itamar Schen, Ido Shahaf, Oren Tropp, Omer Ullman Argov, Ran Zilberstein, Ran El-Yaniv
•
Nov 28, 2024
•
18
2
ビデオモデルなしでのビデオの深度
Video Depth without Video Models
Bingxin Ke, Dominik Narnhofer, Shengyu Huang, Lei Ke, Torben Peters, Katerina Fragkiadaki, Anton Obukhov, Konrad Schindler
•
Nov 28, 2024
•
39
7
AlphaTablets: 単眼ビデオからの3D平面再構築のための一般的な平面表現
AlphaTablets: A Generic Plane Representation for 3D Planar Reconstruction from Monocular Videos
Yuze He, Wang Zhao, Shaohui Liu, Yubin Hu, Yushi Bai, Yu-Hui Wen, Yong-Jin Liu
•
Nov 29, 2024
•
6
2
マルチモーダルな大規模言語モデルに対するドメイン固有の事後トレーニングについて
On Domain-Specific Post-Training for Multimodal Large Language Models
Daixuan Cheng, Shaohan Huang, Ziyu Zhu, Xintong Zhang, Wayne Xin Zhao, Zhongzhi Luan, Bo Dai, Zhenliang Zhang
•
Nov 29, 2024
•
29
3
AC3D: ビデオ拡散における3Dカメラ制御の分析と改善
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers
Sherwin Bahmani, Ivan Skorokhodov, Guocheng Qian, Aliaksandr Siarohin, Willi Menapace, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Nov 27, 2024
•
8
2
一度にすべてのフレームを見る:マルチ軸勾配チェックポイントを使用した効率的な長尺ビデオ理解のためのVideo-Ma^2mba
Look Every Frame All at Once: Video-Ma^2mba for Efficient Long-form Video Understanding with Multi-Axis Gradient Checkpointing
Hosu Lee, Junho Kim, Hyunjun Kim, Yong Man Ro
•
Nov 29, 2024
•
11
2
DeMo: 分離されたモーメンタム最適化
DeMo: Decoupled Momentum Optimization
Bowen Peng, Jeffrey Quesnelle, Diederik P. Kingma
•
Nov 29, 2024
•
6
2
FAM拡散:高解像度画像生成のための周波数と注意の調整による安定した拡散
FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion
Haosen Yang, Adrian Bulat, Isma Hadji, Hai X. Pham, Xiatian Zhu, Georgios Tzimiropoulos, Brais Martinez
•
Nov 27, 2024
•
18
2
DisCoRD: 離散トークンから連続運動へのリクティファイドフローによるデコーディング
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding
Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu
•
Nov 29, 2024
•
10
2
時間ステップ埋め込みによって示される:ビデオ拡散モデルのためのキャッシュの時間
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model
Feng Liu, Shiwei Zhang, Xiaofeng Wang, Yujie Wei, Haonan Qiu, Yuzhong Zhao, Yingya Zhang, Qixiang Ye, Fang Wan
•
Nov 28, 2024
•
19
2
細かい動画モーション制御のための軌跡注意
Trajectory Attention for Fine-grained Video Motion Control
Zeqi Xiao, Wenqi Ouyang, Yifan Zhou, Shuai Yang, Lei Yang, Jianlou Si, Xingang Pan
•
Nov 28, 2024
•
12
2
逆転思考はLLMをより強力な推論者にします。
Reverse Thinking Makes LLMs Stronger Reasoners
Justin Chih-Yao Chen, Zifeng Wang, Hamid Palangi, Rujun Han, Sayna Ebrahimi, Long Le, Vincent Perot, Swaroop Mishra, Mohit Bansal, Chen-Yu Lee, Tomas Pfister
•
Nov 29, 2024
•
23
2
Yi-Lightning テクニカルレポート
Yi-Lightning Technical Report
01. AI, Alan Wake, Albert Wang, Bei Chen, C. X. Lv, Chao Li, Chengen Huang, Chenglin Cai, Chujie Zheng, Daniel Cooper, Ethan Dai, Fan Zhou, Feng Hu, Heng Ji, Howard Qiu, Jiangcheng Zhu, Jun Tian, Katherine Su, Lihuan Zhang, Liying Li, Ming Song, Mou Li, Peng Liu, Qichen Hu, Shawn Wang, Shijun Zhou, Shiyong Li, Tianhang Zhu, Wen Xie, Xiang He, Xiaobo Chen, Xiaohui Hu, Xiaoyi Ren, Xinyao Niu, Yanpeng Li, Yongke Zhao, Yongzhen Luo, Yuchi Xu, Yuxuan Sha, Zhaodong Yan, Zhiyuan Liu, Zirui Zhang
•
Dec 2, 2024
•
29
2