ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
November 25th, 2024
원격 감지 이미지에서 강력한 클라우드 분할을 위한 비전 기반 모델의 적응
Adapting Vision Foundation Models for Robust Cloud Segmentation in Remote Sensing Images
Xuechao Zou, Shun Zhang, Kai Li, Shiying Wang, Junliang Xing, Lei Jin, Congyan Lang, Pin Tao
•
Nov 20, 2024
•
4
2
그들을 통치할 하나: 자연어, 의사 소통, 지각 및 행동을 연결하다
One to rule them all: natural language to bind communication, perception and action
Simone Colombani, Dimitri Ognibene, Giuseppe Boccignone
•
Nov 22, 2024
•
3
2
나의 시간 기계: 개인화된 얼굴 연령 변환
MyTimeMachine: Personalized Facial Age Transformation
Luchao Qi, Jiaye Wu, Bang Gong, Annie N. Wang, David W. Jacobs, Roni Sengupta
•
Nov 21, 2024
•
22
2
WildLMa: 야생에서의 장기간 지속되는 로코-조작
WildLMa: Long Horizon Loco-Manipulation in the Wild
Ri-Zhao Qiu, Yuchen Song, Xuanbin Peng, Sai Aneesh Suryadevara, Ge Yang, Minghuan Liu, Mazeyu Ji, Chengzhe Jia, Ruihan Yang, Xueyan Zou, Xiaolong Wang
•
Nov 22, 2024
•
6
2
조정 기반 패치 재구성을 통한 효율적인 장기 비디오 토큰화
Efficient Long Video Tokenization via Coordinated-based Patch Reconstruction
Huiwon Jang, Sihyun Yu, Jinwoo Shin, Pieter Abbeel, Younggyo Seo
•
Nov 22, 2024
•
11
2
유연한 대형 언어 모델 가드레일 개발 방법론 주제 이탈 감지에 적용
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection
Gabriel Chua, Shing Yee Chan, Shaun Khoo
•
Nov 20, 2024
•
23
2
스타일 주도 생성을 위한 스타일 친화적 SNR 샘플러
Style-Friendly SNR Sampler for Style-Driven Generation
Jooyoung Choi, Chaehun Shin, Yeongtak Oh, Heeseung Kim, Sungroh Yoon
•
Nov 22, 2024
•
35
3
발록: 게임에서의 에이전틱 LLM 및 VLM 추론 성능 측정
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games
Davide Paglieri, Bartłomiej Cupiał, Samuel Coward, Ulyana Piterbarg, Maciej Wolczyk, Akbir Khan, Eduardo Pignatelli, Łukasz Kuciński, Lerrel Pinto, Rob Fergus, Jakob Nicolaus Foerster, Jack Parker-Holder, Tim Rocktäschel
•
Nov 20, 2024
•
18
2
TÜLU 3: 오픈 언어 모델 사후 훈련에서의 선두를 다투다.
TÜLU 3: Pushing Frontiers in Open Language Model Post-Training
Nathan Lambert, Jacob Morrison, Valentina Pyatkin, Shengyi Huang, Hamish Ivison, Faeze Brahman, Lester James V. Miranda, Alisa Liu, Nouha Dziri, Shane Lyu, Yuling Gu, Saumya Malik, Victoria Graf, Jena D. Hwang, Jiangjiang Yang, Ronan Le Bras, Oyvind Tafjord, Chris Wilhelm, Luca Soldaini, Noah A. Smith, Yizhong Wang, Pradeep Dasigi, Hannaneh Hajishirzi
•
Nov 22, 2024
•
63
2
OminiControl: 확산 트랜스포머를 위한 최소하고 범용적인 제어
OminiControl: Minimal and Universal Control for Diffusion Transformer
Zhenxiong Tan, Songhua Liu, Xingyi Yang, Qiaochu Xue, Xinchao Wang
•
Nov 22, 2024
•
60
10
대규모 다중 모달 모델은 대규모 다중 모달 모델의 특징을 해석할 수 있습니다.
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models
Kaichen Zhang, Yifei Shen, Bo Li, Ziwei Liu
•
Nov 22, 2024
•
17
4
비디오에스프레소: 핵심 프레임 선택을 통한 세밀한 비디오 추론을 위한 대규모 체인 오브 씨쓰 데이터셋
VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection
Songhao Han, Wei Huang, Hairong Shi, Le Zhuo, Xiu Su, Shifeng Zhang, Xu Zhou, Xiaojuan Qi, Yue Liao, Si Liu
•
Nov 22, 2024
•
13
3
비디오수리: 오인을 통한 텍스트 대 비디오 생성의 향상 평가 및 지역화된 세부 조정
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement
Daeun Lee, Jaehong Yoon, Jaemin Cho, Mohit Bansal
•
Nov 22, 2024
•
9
3
비디오 확산 사전을 사용한 새로운 시점 추정
Novel View Extrapolation with Video Diffusion Priors
Kunhao Liu, Ling Shao, Shijian Lu
•
Nov 21, 2024
•
10
3