ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
April 3rd, 2025
AnimeGamer: 次ゲーム状態予測を備えた無限アニメライフシミュレーション
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction
Junhao Cheng, Yuying Ge, Yixiao Ge, Jing Liao, Ying Shan
•
Apr 1, 2025
•
66
2
LSNet: 大局を見て、細部に焦点を当てる
LSNet: See Large, Focus Small
Ao Wang, Hui Chen, Zijia Lin, Jungong Han, Guiguang Ding
•
Mar 29, 2025
•
9
3
VerifiAgent: 言語モデル推論における統合検証エージェント
VerifiAgent: a Unified Verification Agent in Language Model Reasoning
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
•
Apr 1, 2025
•
6
2
ターゲット対応型ビデオ拡散モデル
Target-Aware Video Diffusion Models
Taeksoo Kim, Hanbyul Joo
•
Mar 24, 2025
•
5
2
MegaTTS 3:ゼロショット音声合成のためのスパースアライメント強化型潜在拡散トランスフォーマー
MegaTTS 3: Sparse Alignment Enhanced Latent Diffusion Transformer for Zero-Shot Speech Synthesis
Ziyue Jiang, Yi Ren, Ruiqi Li, Shengpeng Ji, Boyang Zhang, Zhenhui Ye, Chen Zhang, Bai Jionghao, Xiaoda Yang, Jialong Zuo, Yu Zhang, Rui Liu, Xiang Yin, Zhou Zhao
•
Feb 26, 2025
•
12
2
R1ゼロライクトレーニングによる視覚空間推論能力の向上
Improved Visual-Spatial Reasoning via R1-Zero-Like Training
Zhenyi Liao, Qingsong Xie, Yanhao Zhang, Zijian Kong, Haonan Lu, Zhenyu Yang, Zhijie Deng
•
Apr 1, 2025
•
62
3
MergeVQ:分離可能なトークン統合と量子化による視覚生成と表現の統一フレームワーク
MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization
Siyuan Li, Luyuan Zhang, Zedong Wang, Juanxi Tian, Cheng Tan, Zicheng Liu, Chang Yu, Qingsong Xie, Haonan Lu, Haoqian Wang, Zhen Lei
•
Apr 1, 2025
•
87
7
事前学習済みLLMにおける適応的レイヤースキッピング
Adaptive Layer-skipping in Pre-trained LLMs
Xuan Luo, Weizhi Wang, Xifeng Yan
•
Mar 31, 2025
•
6
2
R1ゼロライクトレーニングの理解:批判的視点
Understanding R1-Zero-Like Training: A Critical Perspective
Zichen Liu, Changyu Chen, Wenjun Li, Penghui Qi, Tianyu Pang, Chao Du, Wee Sun Lee, Min Lin
•
Mar 26, 2025
•
47
3
ILLUME+: デュアル視覚トークン化と拡散精緻化による統一MLLMの照明
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement
Runhui Huang, Chunwei Wang, Junwei Yang, Guansong Lu, Yunlong Yuan, Jianhua Han, Lu Hou, Wei Zhang, Lanqing Hong, Hengshuang Zhao, Hang Xu
•
Apr 2, 2025
•
23
4
医療用大規模言語モデルは容易に注意散漫になりやすい
Medical large language models are easily distracted
Krithik Vishwanath, Anton Alyakin, Daniel Alexander Alber, Jin Vivian Lee, Douglas Kondziolka, Eric Karl Oermann
•
Apr 1, 2025
•
3
2
ScholarCopilot: 正確な引用を伴う学術執筆のための大規模言語モデルのトレーニング
ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations
Yubo Wang, Xueguang Ma, Ping Nie, Huaye Zeng, Zhiheng Lyu, Yuxuan Zhang, Benjamin Schneider, Yi Lu, Xiang Yue, Wenhu Chen
•
Apr 1, 2025
•
40
2
VideoScene: ビデオ拡散モデルを蒸留してワンステップで3Dシーンを生成する
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step
Hanyang Wang, Fangfu Liu, Jiawei Chi, Yueqi Duan
•
Apr 2, 2025
•
40
2
DASH: VLMの体系的ハルシネーションの検出と評価
DASH: Detection and Assessment of Systematic Hallucinations of VLMs
Maximilian Augustin, Yannic Neuhaus, Matthias Hein
•
Mar 30, 2025
•
12
2
Quamba2:選択的状態空間モデルのための堅牢かつスケーラブルなポストトレーニング量子化フレームワーク
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models
Hung-Yueh Chiang, Chi-Chih Chang, Natalia Frumkin, Kai-Chiang Wu, Mohamed S. Abdelfattah, Diana Marculescu
•
Mar 28, 2025
•
10
2
視覚言語モデルの保護:摂動ベース攻撃におけるガウシアンノイズへの脆弱性の軽減
Safeguarding Vision-Language Models: Mitigating Vulnerabilities to Gaussian Noise in Perturbation-based Attacks
Jiawei Wang, Yushen Zuo, Yuanjun Chai, Zhendong Liu, Yichen Fu, Yichun Feng, Kin-man Lam
•
Apr 2, 2025
•
13
2
PaperBench: AI研究の再現能力を評価する
PaperBench: Evaluating AI's Ability to Replicate AI Research
Giulio Starace, Oliver Jaffe, Dane Sherburn, James Aung, Jun Shern Chan, Leon Maksin, Rachel Dias, Evan Mays, Benjamin Kinsella, Wyatt Thompson, Johannes Heidecke, Amelia Glaese, Tejal Patwardhan
•
Apr 2, 2025
•
36
2
マルチモーダル表現のクロスモーダルアライメントによるOoD検出の強化
Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations
Jeonghyeon Kim, Sangheum Hwang
•
Mar 24, 2025
•
4
1
AIフィードバックを用いた直接選好最適化による独自の人間画像生成モデルの強化
Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback
Sanghyeon Na, Yonggyu Kim, Hyunjoon Lee
•
May 30, 2024
•
22
3
物理的に妥当なビデオ生成に向けて:VLMプランニングによるアプローチ
Towards Physically Plausible Video Generation via VLM Planning
Xindi Yang, Baolu Li, Yiming Zhang, Zhenfei Yin, Lei Bai, Liqian Ma, Zhiyong Wang, Jianfei Cai, Tien-Tsin Wong, Huchuan Lu, Xu Jia
•
Mar 30, 2025
•
39
3
DreamActor-M1:ハイブリッドガイダンスによるホリスティックで表現力豊かかつロバストな人物画像アニメーション
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
Yuxuan Luo, Zhengkun Rong, Lizhen Wang, Longhao Zhang, Tianshu Hu, Yongming Zhu
•
Apr 2, 2025
•
65
7
ビデオ拡散モデルからの関節運動学の蒸留
Articulated Kinematics Distillation from Video Diffusion Models
Xuan Li, Qianli Ma, Tsung-Yi Lin, Yongxin Chen, Chenfanfu Jiang, Ming-Yu Liu, Donglai Xiang
•
Apr 1, 2025
•
24
3