ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
April 30th, 2025
インコンテキスト編集:大規模拡散トランスフォーマーにおけるインコンテキスト生成を活用した指導的画像編集
In-Context Edit: Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer
Zechuan Zhang, Ji Xie, Yu Lu, Zongxin Yang, Yi Yang
•
Apr 29, 2025
•
1
1
最悪ケースのLLM著作権侵害の認証済み緩和策
Certified Mitigation of Worst-Case LLM Copyright Infringement
Jingyu Zhang, Jiacan Yu, Marc Marone, Benjamin Van Durme, Daniel Khashabi
•
Apr 22, 2025
•
7
1
アイデンティティの分離と感情の協調:相関を考慮した感情表現を伴う話し手ポートレート生成
Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation
Weipeng Tan, Chuming Lin, Chengming Xu, FeiFan Xu, Xiaobin Hu, Xiaozhong Ji, Junwei Zhu, Chengjie Wang, Yanwei Fu
•
Apr 25, 2025
•
3
1
YoChameleon: パーソナライズされた視覚と言語生成
YoChameleon: Personalized Vision and Language Generation
Thao Nguyen, Krishna Kumar Singh, Jing Shi, Trung Bui, Yong Jae Lee, Yuheng Li
•
Apr 29, 2025
•
9
1
UniversalRAG: 多様なモダリティと粒度を持つ複数コーパスにわたる検索拡張生成
UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities
Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, Jinheon Baek, Sung Ju Hwang
•
Apr 29, 2025
•
40
1
X-Fusion: 凍結された大規模言語モデルへの新たなモダリティの導入
X-Fusion: Introducing New Modality to Frozen Large Language Models
Sicheng Mo, Thao Nguyen, Xun Huang, Siddharth Srinivasan Iyer, Yijun Li, Yuchen Liu, Abhishek Tandon, Eli Shechtman, Krishna Kumar Singh, Yong Jae Lee, Bolei Zhou, Yuheng Li
•
Apr 29, 2025
•
4
1
評価的思考に向けて:進化する報酬モデルを用いたメタポリシー最適化
Toward Evaluative Thinking: Meta Policy Optimization with Evolving Reward Models
Zae Myung Kim, Chanwoo Park, Vipul Raheja, Dongyeop Kang
•
Apr 28, 2025
•
23
6
ReasonIR: 推論タスクのための検索モデルのトレーニング
ReasonIR: Training Retrievers for Reasoning Tasks
Rulin Shao, Rui Qiao, Varsha Kishore, Niklas Muennighoff, Xi Victoria Lin, Daniela Rus, Bryan Kian Hsiang Low, Sewon Min, Wen-tau Yih, Pang Wei Koh, Luke Zettlemoyer
•
Apr 29, 2025
•
29
1
リーダーボードの錯覚
The Leaderboard Illusion
Shivalika Singh, Yiyang Nan, Alex Wang, Daniel D'Souza, Sayash Kapoor, Ahmet Üstün, Sanmi Koyejo, Yuntian Deng, Shayne Longpre, Noah Smith, Beyza Ermis, Marzieh Fadaee, Sara Hooker
•
Apr 29, 2025
•
19
1
TesserAct: 4D エンボディード・ワールドモデルの学習
TesserAct: Learning 4D Embodied World Models
Haoyu Zhen, Qiao Sun, Hongxin Zhang, Junyan Li, Siyuan Zhou, Yilun Du, Chuang Gan
•
Apr 29, 2025
•
10
1
ISDrama: マルチモーダルプロンプティングによる没入型空間ドラマ生成
ISDrama: Immersive Spatial Drama Generation through Multimodal Prompting
Yu Zhang, Wenxiang Guo, Changhao Pan, Zhiyuan Zhu, Tao Jin, Zhou Zhao
•
Apr 29, 2025
•
7
1
TreeHop: マルチホップ質問応答のための次クエリ埋め込みの効率的な生成とフィルタリング
TreeHop: Generate and Filter Next Query Embeddings Efficiently for Multi-hop Question Answering
Zhonghao Li, Kunpeng Zhang, Jinghuai Ou, Shuliang Liu, Xuming Hu
•
Apr 28, 2025
•
2
1
大規模言語モデルにおける推論のための強化学習:1つの訓練例を用いて
Reinforcement Learning for Reasoning in Large Language Models with One Training Example
Yiping Wang, Qing Yang, Zhiyuan Zeng, Liliang Ren, Lucas Liu, Baolin Peng, Hao Cheng, Xuehai He, Kuan Wang, Jianfeng Gao, Weizhu Chen, Shuohang Wang, Simon Shaolei Du, Yelong Shen
•
Apr 29, 2025
•
36
3
視覚言語モデルを用いた3D物体検出のレビュー
A Review of 3D Object Detection with Vision-Language Models
Ranjan Sapkota, Konstantinos I Roumeliotis, Rahul Harsha Cheppally, Marco Flores Calero, Manoj Karkee
•
Apr 25, 2025
•
1
1