ChatPaper.ai
メニューを開く
ホーム
今日の論文
arXiv
HuggingFace
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
November 25th, 2024
リモートセンシング画像における頑健なクラウドセグメンテーションのためのビジョン基盤モデルの適応
Adapting Vision Foundation Models for Robust Cloud Segmentation in Remote Sensing Images
Xuechao Zou, Shun Zhang, Kai Li, Shiying Wang, Junliang Xing, Lei Jin, Congyan Lang, Pin Tao
•
Nov 20, 2024
•
4
2
すべてを統べるもの:自然言語によるコミュニケーション、知覚、行動の結びつけ
One to rule them all: natural language to bind communication, perception and action
Simone Colombani, Dimitri Ognibene, Giuseppe Boccignone
•
Nov 22, 2024
•
3
2
私のタイムマシン:個人用顔年齢変換
MyTimeMachine: Personalized Facial Age Transformation
Luchao Qi, Jiaye Wu, Bang Gong, Annie N. Wang, David W. Jacobs, Roni Sengupta
•
Nov 21, 2024
•
22
2
WildLMa: 野生環境における長期間のロコ・マニピュレーション
WildLMa: Long Horizon Loco-Manipulation in the Wild
Ri-Zhao Qiu, Yuchen Song, Xuanbin Peng, Sai Aneesh Suryadevara, Ge Yang, Minghuan Liu, Mazeyu Ji, Chengzhe Jia, Ruihan Yang, Xueyan Zou, Xiaolong Wang
•
Nov 22, 2024
•
6
2
協調ベースのパッチ再構成を用いた効率的な長時間ビデオのトークン化
Efficient Long Video Tokenization via Coordinated-based Patch Reconstruction
Huiwon Jang, Sihyun Yu, Jinwoo Shin, Pieter Abbeel, Younggyo Seo
•
Nov 22, 2024
•
11
2
柔軟な大規模言語モデルのガードレール開発方法論 オフトピックなプロンプト検出に適用
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection
Gabriel Chua, Shing Yee Chan, Shaun Khoo
•
Nov 20, 2024
•
23
2
スタイル駆動生成のためのスタイルに優しいSNRサンプラー
Style-Friendly SNR Sampler for Style-Driven Generation
Jooyoung Choi, Chaehun Shin, Yeongtak Oh, Heeseung Kim, Sungroh Yoon
•
Nov 22, 2024
•
35
3
BALROG: ゲームにおけるエージェンティックLLMとVLM推論のベンチマーク化
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games
Davide Paglieri, Bartłomiej Cupiał, Samuel Coward, Ulyana Piterbarg, Maciej Wolczyk, Akbir Khan, Eduardo Pignatelli, Łukasz Kuciński, Lerrel Pinto, Rob Fergus, Jakob Nicolaus Foerster, Jack Parker-Holder, Tim Rocktäschel
•
Nov 20, 2024
•
18
2
TÜLU 3: オープン言語モデルの事後トレーニングにおけるフロンティアの拡大
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training
Nathan Lambert, Jacob Morrison, Valentina Pyatkin, Shengyi Huang, Hamish Ivison, Faeze Brahman, Lester James V. Miranda, Alisa Liu, Nouha Dziri, Shane Lyu, Yuling Gu, Saumya Malik, Victoria Graf, Jena D. Hwang, Jiangjiang Yang, Ronan Le Bras, Oyvind Tafjord, Chris Wilhelm, Luca Soldaini, Noah A. Smith, Yizhong Wang, Pradeep Dasigi, Hannaneh Hajishirzi
•
Nov 22, 2024
•
63
2
OminiControl: 拡散トランスフォーマー向けの最小かつ汎用制御
OminiControl: Minimal and Universal Control for Diffusion Transformer
Zhenxiong Tan, Songhua Liu, Xingyi Yang, Qiaochu Xue, Xinchao Wang
•
Nov 22, 2024
•
60
10
大規模なマルチモーダルモデルは、大規模なマルチモーダルモデル内の特徴を解釈できる可能性があります。
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models
Kaichen Zhang, Yifei Shen, Bo Li, Ziwei Liu
•
Nov 22, 2024
•
17
4
VideoEspresso:細かい粒度のビデオ推論のための大規模な連鎖思考データセットによるコアフレーム選択
VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection
Songhao Han, Wei Huang, Hairong Shi, Le Zhuo, Xiu Su, Shifeng Zhang, Xu Zhou, Xiaojuan Qi, Yue Liao, Si Liu
•
Nov 22, 2024
•
13
3
VideoRepair:不一致評価と局所修正を通じたテキストからビデオへの生成の改善
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement
Daeun Lee, Jaehong Yoon, Jaemin Cho, Mohit Bansal
•
Nov 22, 2024
•
9
3
ビデオ拡散事前情報を用いた新しい視点の推定
Novel View Extrapolation with Video Diffusion Priors
Kunhao Liu, Ling Shao, Shijian Lu
•
Nov 21, 2024
•
10
3