ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
April 10th, 2025
WildGS-SLAM: 動的環境における単眼ガウススプラッティングSLAM
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments
Jianhao Zheng, Zihan Zhu, Valentin Bieri, Marc Pollefeys, Songyou Peng, Iro Armeni
•
Apr 4, 2025
•
10
3
オブジェクト中心学習は終わったのか?
Are We Done with Object-Centric Learning?
Alexander Rubinstein, Ameya Prabhu, Matthias Bethge, Seong Joon Oh
•
Apr 9, 2025
•
6
2
DiTaiListener: 拡散モデルによる制御可能な高忠実度リスナービデオ生成
DiTaiListener: Controllable High Fidelity Listener Video Generation with Diffusion
Maksim Siniukov, Di Chang, Minh Tran, Hongkun Gong, Ashutosh Chaubey, Mohammad Soleymani
•
Apr 5, 2025
•
10
2
欠落した前提が過剰思考を助長する:推論モデルは批判的思考能力を失いつつあるのか?
Missing Premise exacerbates Overthinking: Are Reasoning Models losing Critical Thinking Skill?
Chenrui Fan, Ming Li, Lichao Sun, Tianyi Zhou
•
Apr 9, 2025
•
39
3
OmniCaptioner: すべてを統べるキャプショナー
OmniCaptioner: One Captioner to Rule Them All
Yiting Lu, Jiakang Yuan, Zhen Li, Shitian Zhao, Qi Qin, Xinyue Li, Le Zhuo, Licheng Wen, Dongyang Liu, Yuewen Cao, Xiangchao Yan, Xin Li, Botian Shi, Tao Chen, Zhibo Chen, Lei Bai, Bo Zhang, Peng Gao
•
Apr 9, 2025
•
20
2
RobustDexGrasp: 単一視点知覚による一般物体のロバストな巧緻把持
RobustDexGrasp: Robust Dexterous Grasping of General Objects from Single-view Perception
Hui Zhang, Zijian Wu, Linyi Huang, Sammy Christen, Jie Song
•
Apr 7, 2025
•
5
2
条件付き画像生成を評価するための統合エージェントフレームワーク
A Unified Agentic Framework for Evaluating Conditional Image Generation
Jifang Wang, Xue Yang, Longyue Wang, Zhenran Xu, Yiyu Wang, Yaowei Wang, Weihua Luo, Kaifu Zhang, Baotian Hu, Min Zhang
•
Apr 9, 2025
•
30
2
言語モデルからの高速制御生成:適応的加重棄却サンプリングを用いた手法
Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling
Benjamin Lipkin, Benjamin LeBrun, Jacob Hoover Vigly, João Loula, David R. MacIver, Li Du, Jason Eisner, Ryan Cotterell, Vikash Mansinghka, Timothy J. O'Donnell, Alexander K. Lew, Tim Vieira
•
Apr 7, 2025
•
3
2
DDT: 分離拡散トランスフォーマー
DDT: Decoupled Diffusion Transformer
Shuai Wang, Zhi Tian, Weilin Huang, Limin Wang
•
Apr 8, 2025
•
73
3
自己操舵型言語モデル
Self-Steering Language Models
Gabriel Grand, Joshua B. Tenenbaum, Vikash K. Mansinghka, Alexander K. Lew, Jacob Andreas
•
Apr 9, 2025
•
18
2
言語モデルの推論能力の進展を冷静に見つめる:再現性への課題と道筋
A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility
Andreas Hochlehnert, Hardik Bhatnagar, Vishaal Udandarao, Samuel Albanie, Ameya Prabhu, Matthias Bethge
•
Apr 9, 2025
•
21
3
通時的な言語変化発見のための言語モデルの事前学習
Pretraining Language Models for Diachronic Linguistic Change Discovery
Elisabeth Fittschen, Sabrina Li, Tom Lippincott, Leshem Choshen, Craig Messner
•
Apr 7, 2025
•
6
2
GenDoP: オートレグレッシブなカメラ軌道生成による撮影監督
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography
Mengchen Zhang, Tong Wu, Jing Tan, Ziwei Liu, Gordon Wetzstein, Dahua Lin
•
Apr 9, 2025
•
23
2
VideoChat-R1:強化学習による微調整を介した時空間知覚の強化
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
Xinhao Li, Ziang Yan, Desen Meng, Lu Dong, Xiangyu Zeng, Yinan He, Yali Wang, Yu Qiao, Yi Wang, Limin Wang
•
Apr 9, 2025
•
10
2
RuOpinionNE-2024: ロシア語ニューステキストからの意見タプル抽出
RuOpinionNE-2024: Extraction of Opinion Tuples from Russian News Texts
Natalia Loukachevitch, Natalia Tkachenko, Anna Lapanitsyna, Mikhail Tikhomirov, Nicolay Rusnachenko
•
Apr 9, 2025
•
4
3
動画内のあらゆるものをキャプション化:時空間的マルチモーダルプロンプティングによる細粒度オブジェクト中心キャプショニング
Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting
Yunlong Tang, Jing Bi, Chao Huang, Susan Liang, Daiki Shimada, Hang Hua, Yunzhong Xiao, Yizhi Song, Pinxin Liu, Mingqian Feng, Junjia Guo, Zhuo Liu, Luchuan Song, Ali Vosoughi, Jinxi He, Liu He, Zeliang Zhang, Jiebo Luo, Chenliang Xu
•
Apr 7, 2025
•
16
1
マスクドシーンモデリング:3Dシーン理解における教師あり学習と自己教師あり学習のギャップを縮める
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding
Pedro Hermosilla, Christian Stippel, Leon Sick
•
Apr 9, 2025
•
9
2
FantasyTalking:コヒーレントなモーション合成によるリアルなトーキングポートレート生成
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis
Mengchao Wang, Qiang Wang, Fan Jiang, Yaqi Fan, Yunpeng Zhang, Yonggang Qi, Kun Zhao, Mu Xu
•
Apr 7, 2025
•
35
3
OLMoTrace: 言語モデルの出力を数兆のトレーニングトークンに遡るトレース
OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens
Jiacheng Liu, Taylor Blanton, Yanai Elazar, Sewon Min, YenSung Chen, Arnavi Chheda-Kothary, Huy Tran, Byron Bischoff, Eric Marsh, Michael Schmitz, Cassidy Trier, Aaron Sarnat, Jenna James, Jon Borchardt, Bailey Kuehl, Evie Cheng, Karen Farley, Sruthi Sreeram, Taira Anderson, David Albright, Carissa Schoenick, Luca Soldaini, Dirk Groeneveld, Rock Yuren Pang, Pang Wei Koh, Noah A. Smith, Sophie Lebrecht, Yejin Choi, Hannaneh Hajishirzi, Ali Farhadi, Jesse Dodge
•
Apr 9, 2025
•
73
3
SkillWeaver: Webエージェントはスキルを発見・磨くことで自己改善できる
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
•
Apr 9, 2025
•
0
1