ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
March 31st, 2025
推奨する前に考える:逐次推薦における潜在的な推論能力の解放
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation
Jiakai Tang, Sunhao Dai, Teng Shi, Jun Xu, Xu Chen, Wen Chen, Wu Jian, Yuning Jiang
•
Mar 28, 2025
•
35
2
知覚的に正確な3Dトーキングヘッド生成:新たな定義、 スピーチメッシュ表現、および評価指標
Perceptually Accurate 3D Talking Head Generation: New Definitions, Speech-Mesh Representation, and Evaluation Metrics
Lee Chae-Yeon, Oh Hyun-Bin, Han EunGi, Kim Sung-Bin, Suekyeong Nam, Tae-Hyun Oh
•
Mar 26, 2025
•
22
3
MedAgent-Pro:推論エージェントワークフローによるマルチモーダルエビデンスベース医療診断に向けて
MedAgent-Pro: Towards Multi-modal Evidence-based Medical Diagnosis via Reasoning Agentic Workflow
Ziyue Wang, Junde Wu, Chang Han Low, Yueming Jin
•
Mar 21, 2025
•
6
2
ORIGEN: テキストから画像生成におけるゼロショット3D方向接地
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation
Yunhong Min, Daehyeon Choi, Kyeongmin Yeo, Jihyun Lee, Minhyuk Sung
•
Mar 28, 2025
•
24
3
人間のフィードバックからの強化学習におけるデータスケーリングの傾向と影響の探求
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback
Wei Shen, Guanlin Liu, Zheng Wu, Ruofei Zhu, Qingping Yang, Chao Xin, Yu Yue, Lin Yan
•
Mar 28, 2025
•
44
2
物理学:大学レベルの物理問題解決における基盤モデルのベンチマーキング
PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving
Kaiyue Feng, Yilun Zhao, Yixin Liu, Tianyu Yang, Chen Zhao, John Sous, Arman Cohan
•
Mar 26, 2025
•
17
2
生体力学に正確な骨格を用いた人間の再構築
Reconstructing Humans with a Biomechanically Accurate Skeleton
Yan Xia, Xiaowei Zhou, Etienne Vouga, Qixing Huang, Georgios Pavlakos
•
Mar 27, 2025
•
9
2
大規模推論モデルのための効率的な推論手法の調査:言語、マルチモーダル、そしてその先へ
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond
Xiaoye Qu, Yafu Li, Zhaochen Su, Weigao Sun, Jianhao Yan, Dongrui Liu, Ganqu Cui, Daizong Liu, Shuxian Liang, Junxian He, Peng Li, Wei Wei, Jing Shao, Chaochao Lu, Yue Zhang, Xian-Sheng Hua, Bowen Zhou, Yu Cheng
•
Mar 27, 2025
•
39
4
あなたのViTは密かに画像セグメンテーションモデルである
Your ViT is Secretly an Image Segmentation Model
Tommie Kerssies, Niccolò Cavagnero, Alexander Hermans, Narges Norouzi, Giuseppe Averta, Bastian Leibe, Gijs Dubbelman, Daan de Geus
•
Mar 24, 2025
•
21
2
Hi3DGen: 画像からの高精細3Dジオメトリ生成における法線ブリッジング
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han
•
Mar 28, 2025
•
11
2
ソフトウェアエンジニアリングのためのAIへの挑戦と道筋
Challenges and Paths Towards AI for Software Engineering
Alex Gu, Naman Jain, Wen-Ding Li, Manish Shetty, Yijia Shao, Ziyang Li, Diyi Yang, Kevin Ellis, Koushik Sen, Armando Solar-Lezama
•
Mar 28, 2025
•
4
2
OThink-MR1: 動的強化学習によるマルチモーダル汎用推論能力の促進
OThink-MR1: Stimulating multimodal generalized reasoning capabilities via dynamic reinforcement learning
Zhiyuan Liu, Yuting Zhang, Feng Liu, Changwang Zhang, Ying Sun, Jun Wang
•
Mar 20, 2025
•
26
3
AdaptiVocab:軽量な語彙適応による特定領域における大規模言語モデルの効率化
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation
Itay Nakash, Nitay Calderon, Eyal Ben David, Elad Hoffer, Roi Reichart
•
Mar 25, 2025
•
75
2
SparseFlex: 高解像度かつ任意トポロジーの3D形状モデリング
SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling
Xianglong He, Zi-Xin Zou, Chia-Hao Chen, Yuan-Chen Guo, Ding Liang, Chun Yuan, Wanli Ouyang, Yan-Pei Cao, Yangguang Li
•
Mar 27, 2025
•
9
2
大規模言語モデルにおける大規模活性化の精緻な分析
A Refined Analysis of Massive Activations in LLMs
Louis Owen, Nilabhra Roy Chowdhury, Abhay Kumar, Fabian Güra
•
Mar 28, 2025
•
14
3
Zero4D:既存のビデオ拡散モデルを用いた単一ビデオからのトレーニング不要な4Dビデオ生成
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion Model
Jangho Park, Taesung Kwon, Jong Chul Ye
•
Mar 28, 2025
•
18
2
ビデオ中の任意の動きのセグメンテーション
Segment Any Motion in Videos
Nan Huang, Wenzhao Zheng, Chenfeng Xu, Kurt Keutzer, Shanghang Zhang, Angjoo Kanazawa, Qianqian Wang
•
Mar 28, 2025
•
17
2
ReFeed: フィードバックに対する内省的推論を用いた多次元要約の精緻化
ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback
Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song
•
Mar 27, 2025
•
20
3
SWI: 大規模言語モデルにおける意図を持った発話
SWI: Speaking with Intent in Large Language Models
Yuwei Yin, EunJeong Hwang, Giuseppe Carenini
•
Mar 27, 2025
•
2
2
Free4D: 時空間的一貫性を備えたチューニング不要の4Dシーン生成
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency
Tianqi Liu, Zihao Huang, Zhaoxi Chen, Guangcong Wang, Shoukang Hu, Liao Shen, Huiqiang Sun, Zhiguo Cao, Wei Li, Ziwei Liu
•
Mar 26, 2025
•
21
2
X^{2}-ガウシアン:連続時間トモグラフィック再構成のための4次元放射ガウシアンスプラッティング
X^{2}-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction
Weihao Yu, Yuanhao Cai, Ruyi Zha, Zhiwen Fan, Chenxin Li, Yixuan Yuan
•
Mar 27, 2025
•
3
2
4D-Bench: 4次元オブジェクト理解のためのマルチモーダル大規模言語モデルのベンチマーキング
4D-Bench: Benchmarking Multi-modal Large Language Models for 4D Object Understanding
Wenxuan Zhu, Bing Li, Cheng Zheng, Jinjie Mai, Jun Chen, Letian Jiang, Abdullah Hamdi, Sara Rojas Martinez, Chia-Wen Lin, Mohamed Elhoseiny, Bernard Ghanem
•
Mar 22, 2025
•
8
3
大規模マルチモーダルモデルをオープンワールド画像分類器として活用する研究
On Large Multimodal Models as Open-World Image Classifiers
Alessandro Conti, Massimiliano Mancini, Enrico Fini, Yiming Wang, Paolo Rota, Elisa Ricci
•
Mar 27, 2025
•
5
2