ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
March 3rd, 2025
DexGraspVLA: 汎用巧緻把持に向けた視覚-言語-行動フレームワーク
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping
Yifan Zhong, Xuchuan Huang, Ruochong Li, Ceyao Zhang, Yitao Liang, Yaodong Yang, Yuanpei Chen
•
Feb 28, 2025
•
9
2
DeepSolution: ツリーベースの探索と双方向思考による複雑なエンジニアリングソリューション設計の強化
DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinking
Zhuoqun Li, Haiyang Yu, Xuanang Chen, Hongyu Lin, Yaojie Lu, Fei Huang, Xianpei Han, Yongbin Li, Le Sun
•
Feb 28, 2025
•
40
4
SoS1: O1およびR1に類似した推論LLMは二乗和ソルバーである
SoS1: O1 and R1-Like Reasoning LLMs are Sum-of-Square Solvers
Kechen Li, Wenqi Zhu, Coralia Cartis, Tianbo Ji, Shiwei Liu
•
Feb 27, 2025
•
22
2
LiteASR: 低ランク近似による効率的な自動音声認識
LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation
Keisuke Kamahori, Jungo Kasai, Noriyuki Kojima, Baris Kasikci
•
Feb 27, 2025
•
13
2
選好学習がLLMの心理カウンセリング能力を解き放つ
Preference Learning Unlocks LLMs' Psycho-Counseling Skills
Mian Zhang, Shaun M. Eack, Zhiyu Zoey Chen
•
Feb 27, 2025
•
7
2
なぜそうなのか:視覚基盤モデルが自己説明可能な分類器としての役割
Tell me why: Visual foundation models as self-explainable classifiers
Hugues Turbé, Mina Bjelogrlic, Gianmarco Mengaldo, Christian Lovis
•
Feb 26, 2025
•
11
2
ドラフトの連鎖:少ない記述で迅速に思考する
Chain of Draft: Thinking Faster by Writing Less
Silei Xu, Wenhao Xie, Lingxiao Zhao, Pengcheng He
•
Feb 25, 2025
•
48
4
最適な脳細胞死
Optimal Brain Apoptosis
Mingyuan Sun, Zheng Fang, Jiaxu Wang, Junjie Jiang, Delei Kong, Chenming Hu, Yuetong Fang, Renjing Xu
•
Feb 25, 2025
•
10
2
ImageNetをテキストから画像生成に活用する限界はどこまでか?
How far can we go with ImageNet for Text-to-Image generation?
L. Degeorge, A. Ghosh, N. Dufour, D. Picard, V. Kalogeiton
•
Feb 28, 2025
•
26
2
LettuceDetect: RAGアプリケーションのための幻覚検出フレームワーク
LettuceDetect: A Hallucination Detection Framework for RAG Applications
Ádám Kovács, Gábor Recski
•
Feb 24, 2025
•
11
2
HAIC: マルチモーダル大規模言語モデルのためのより優れたキャプションによる人間の行動理解と生成の改善
HAIC: Improving Human Action Understanding and Generation with Better Captions for Multi-modal Large Language Models
Xiao Wang, Jingyun Hua, Weihong Lin, Yuanxing Zhang, Fuzheng Zhang, Jianlong Wu, Di Zhang, Liqiang Nie
•
Feb 28, 2025
•
2
2
予測的データ選択:予測するデータが教えるデータである
Predictive Data Selection: The Data That Predicts Is the Data That Teaches
Kashun Shum, Yuzhen Huang, Hongjian Zou, Ding Qi, Yixuan Liao, Xiaoxin Chen, Qian Liu, Junxian He
•
Mar 2, 2025
•
57
2
MIGE: マルチモーダル命令ベースの画像生成と編集のための統合フレームワーク
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing
Xueyun Tian, Wei Li, Bingbing Xu, Yige Yuan, Yuanzhuo Wang, Huawei Shen
•
Feb 28, 2025
•
5
2
単一ステップ報酬によるマルチターンコード生成
Multi-Turn Code Generation Through Single-Step Rewards
Arnav Kumar Jain, Gonzalo Gonzalez-Pumariega, Wayne Chen, Alexander M Rush, Wenting Zhao, Sanjiban Choudhury
•
Feb 27, 2025
•
31
2
TeleRAG: ルックアヘッド検索を用いた効率的な検索拡張生成推論
TeleRAG: Efficient Retrieval-Augmented Generation Inference with Lookahead Retrieval
Chien-Yu Lin, Keisuke Kamahori, Yiyu Liu, Xiaoxiang Shi, Madhav Kashyap, Yile Gu, Rulin Shao, Zihao Ye, Kan Zhu, Stephanie Wang, Arvind Krishnamurthy, Rohan Kadekodi, Luis Ceze, Baris Kasikci
•
Feb 28, 2025
•
11
2
EgoNormia: 物理的社会的規範理解のベンチマーキング
EgoNormia: Benchmarking Physical Social Norm Understanding
MohammadHossein Rezaei, Yicheng Fu, Phil Cuvin, Caleb Ziems, Yanzhe Zhang, Hao Zhu, Diyi Yang
•
Feb 27, 2025
•
5
2
ViDoRAG: 動的反復推論エージェントによる視覚的文書検索拡張生成
ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents
Qiuchen Wang, Ruixue Ding, Zehui Chen, Weiqi Wu, Shihang Wang, Pengjun Xie, Feng Zhao
•
Feb 25, 2025
•
20
2
ヒューマノイドにおける視覚ベースの器用な操作のためのSim-to-Real強化学習
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids
Toru Lin, Kartik Sachdev, Linxi Fan, Jitendra Malik, Yuke Zhu
•
Feb 27, 2025
•
16
2