ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
February 7th, 2025
MotionLab: モーション条件モーションパラダイムを介した統一された人間の動作生成と編集
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm
Ziyan Guo, Zeyu Hu, Na Zhao, De Wen Soh
•
Feb 4, 2025
•
18
3
異種マスク付き自己回帰を用いた実世界アクションビデオダイナミクスの学習
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression
Lirui Wang, Kevin Zhao, Chaoqi Liu, Xinlei Chen
•
Feb 6, 2025
•
6
3
ビデオ生成における物理的理解へ向けて:3Dポイント正則化アプローチ
Towards Physical Understanding in Video Generation: A 3D Point Regularization Approach
Yunuo Chen, Junli Cao, Anil Kag, Vidit Goel, Sergei Korolev, Chenfanfu Jiang, Sergey Tulyakov, Jian Ren
•
Feb 5, 2025
•
9
3
PlotGen: マルチエージェントLLMに基づく科学データの視覚化:マルチモーダルフィードバックを介した
PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
6
2
反射を伴う弱から強への拡散
Weak-to-Strong Diffusion with Reflection
Lichen Bai, Masashi Sugiyama, Zeke Xie
•
Feb 1, 2025
•
23
2
Ola: 進歩的なモダリティアラインメントによるオムニモーダル言語モデルのフロンティアの拡大
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment
Zuyan Liu, Yuhao Dong, Jiahui Wang, Ziwei Liu, Winston Hu, Jiwen Lu, Yongming Rao
•
Feb 6, 2025
•
30
2
MotionCanvas: 制御可能な画像からビデオへのシネマティックショットデザイン
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation
Jinbo Xing, Long Mai, Cusuh Ham, Jiahui Huang, Aniruddha Mahapatra, Chi-Wing Fu, Tien-Tsin Wong, Feng Liu
•
Feb 6, 2025
•
18
3
MAGA: 大規模ジャンル・視聴者再構築による事前学習コーパスの拡張
MAGA: MAssive Genre-Audience Reformulation to Pretraining Corpus Expansion
Xintong Hao, Ke Shen, Chenggang Li
•
Feb 6, 2025
•
22
2
言語モデルにおける解釈と調整の向上のために特徴フローを分析する
Analyze Feature Flow to Enhance Interpretation and Steering in Language Models
Daniil Laptev, Nikita Balagansky, Yaroslav Aksenov, Daniil Gavrilov
•
Feb 5, 2025
•
60
2
低リソース言語のためのコード生成の向上:銀の弾丸はない
Enhancing Code Generation for Low-Resource Languages: No Silver Bullet
Alessandro Giagnorio, Alberto Martin-Lopez, Gabriele Bavota
•
Jan 31, 2025
•
5
2
ScoreFlow: スコアベースの選好最適化を通じたLLMエージェントワークフローのマスタリング
ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization
Yinjie Wang, Ling Yang, Guohao Li, Mengdi Wang, Bryon Aragam
•
Feb 6, 2025
•
19
2
ChartCitor: 細かいチャートビジュアルの帰属を行うためのマルチエージェントフレームワーク
ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution
Kanika Goswami, Puneet Mathur, Ryan Rossi, Franck Dernoncourt
•
Feb 3, 2025
•
7
2
ウルトラIF:野生からの指示遵守の向上
UltraIF: Advancing Instruction Following from the Wild
Kaikai An, Li Sheng, Ganqu Cui, Shuzheng Si, Ning Ding, Yu Cheng, Baobao Chang
•
Feb 6, 2025
•
23
2
DynVFX: 動的コンテンツを用いたリアルなビデオの拡張
DynVFX: Augmenting Real Videos with Dynamic Content
Danah Yatim, Rafail Fridman, Omer Bar-Tal, Tali Dekel
•
Feb 5, 2025
•
30
3
Llasa: ラマベースの音声合成のためのトレーニング時間と推論時間の計算のスケーリング
Llasa: Scaling Train-Time and Inference-Time Compute for Llama-based Speech Synthesis
Zhen Ye, Xinfa Zhu, Chi-Min Chan, Xinsheng Wang, Xu Tan, Jiahe Lei, Yi Peng, Haohe Liu, Yizhu Jin, Zheqi DAI, Hongzhan Lin, Jianyi Chen, Xingjian Du, Liumeng Xue, Yunlin Chen, Zhifei Li, Lei Xie, Qiuqiang Kong, Yike Guo, Wei Xue
•
Feb 6, 2025
•
25
4
優れたモデルは似たように考えるため、これがAI監督を弱体化させる
Great Models Think Alike and this Undermines AI Oversight
Shashwat Goel, Joschka Struber, Ilze Amanda Auzina, Karuna K Chandra, Ponnurangam Kumaraguru, Douwe Kiela, Ameya Prabhu, Matthias Bethge, Jonas Geiping
•
Feb 6, 2025
•
34
2
ConceptAttention: 拡散トランスフォーマーは、高度に解釈可能な特徴を学習します。
ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features
Alec Helbling, Tuna Han Salih Meral, Ben Hoover, Pinar Yanardag, Duen Horng Chau
•
Feb 6, 2025
•
38
3
AlphaGeometry2を使用して、オリンピアードの幾何学問題を解決する際の金メダリストのパフォーマンス
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
•
Feb 5, 2025
•
44
5
プロンプトの内容を超えて:コンテンツ形式統合型プロンプト最適化によるLLMパフォーマンスの向上
Beyond Prompt Content: Enhancing LLM Performance via Content-Format Integrated Prompt Optimization
Yuanye Liu, Jiahang Xu, Li Lyna Zhang, Qi Chen, Xuan Feng, Yang Chen, Zhongxin Guo, Yuqing Yang, Cheng Peng
•
Feb 6, 2025
•
13
2
簡単なインタラクションでLLMから有害なジェイルブレイクを引き出す
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions
Yik Siu Chan, Narutatsu Ri, Yuxin Xiao, Marzyeh Ghassemi
•
Feb 6, 2025
•
3
2
PILAF: 報酬モデリングのための最適な人間の選好サンプリング
PILAF: Optimal Human Preference Sampling for Reward Modeling
Yunzhen Feng, Ariel Kwiatkowski, Kunhao Zheng, Julia Kempe, Yaqi Duan
•
Feb 6, 2025
•
11
2
BOLT: 蒸留なしで言語モデル内の長い連鎖思考をブートストラップする
BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation
Bo Pang, Hanze Dong, Jiacheng Xu, Silvio Savarese, Yingbo Zhou, Caiming Xiong
•
Feb 6, 2025
•
24
2