ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
May 15th, 2025
BLIP3-o: 완전히 개방된 통합 멀티모달 모델 패밀리 - 아키텍처, 학습 및 데이터셋
BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset
Jiuhai Chen, Zhiyang Xu, Xichen Pan, Yushi Hu, Can Qin, Tom Goldstein, Lifu Huang, Tianyi Zhou, Saining Xie, Silvio Savarese, Le Xue, Caiming Xiong, Ran Xu
•
May 14, 2025
•
40
1
DeCLIP: 개방형 어휘 집중 인식을 위한 분리 학습
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception
Junjie Wang, Bin Chen, Yulin Li, Bin Kang, Yichi Chen, Zhuotao Tian
•
May 7, 2025
•
35
1
DeepSeek-V3에 대한 통찰: AI 아키텍처를 위한 하드웨어의 확장 과제와 성찰
Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures
Chenggang Zhao, Chengqi Deng, Chong Ruan, Damai Dai, Huazuo Gao, Jiashi Li, Liyue Zhang, Panpan Huang, Shangyan Zhou, Shirong Ma, Wenfeng Liang, Ying He, Yuqing Wang, Yuxuan Liu, Y. X. Wei
•
May 14, 2025
•
23
1
Marigold: 이미지 분석을 위한 확산 기반 이미지 생성기의 경제적 적응
Marigold: Affordable Adaptation of Diffusion-Based Image Generators for Image Analysis
Bingxin Ke, Kevin Qu, Tianfu Wang, Nando Metzger, Shengyu Huang, Bo Li, Anton Obukhov, Konrad Schindler
•
May 14, 2025
•
13
1
UniSkill: 크로스-엠보디먼트 스킬 표현을 통한 인간 동영상 모방
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations
Hanjung Kim, Jaehyun Kang, Hyolim Kang, Meedeum Cho, Seon Joo Kim, Youngwoon Lee
•
May 13, 2025
•
12
1
SweRank: 코드 순위 기반 소프트웨어 이슈 지역화
SweRank: Software Issue Localization with Code Ranking
Revanth Gangi Reddy, Tarun Suresh, JaeHyeok Doo, Ye Liu, Xuan Phi Nguyen, Yingbo Zhou, Semih Yavuz, Caiming Xiong, Heng Ji, Shafiq Joty
•
May 7, 2025
•
6
1
CAST: RGB 이미지에서 구성 요소 정렬 3D 장면 재구성
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image
Kaixin Yao, Longwen Zhang, Xinhao Yan, Yan Zeng, Qixuan Zhang, Lan Xu, Wei Yang, Jiayuan Gu, Jingyi Yu
•
Feb 18, 2025
•
5
2
WavReward: 일반화된 보상 평가기를 갖춘 음성 대화 모델
WavReward: Spoken Dialogue Models With Generalist Reward Evaluators
Shengpeng Ji, Tianle Liang, Yangzhuo Li, Jialong Zuo, Minghui Fang, Jinzheng He, Yifu Chen, Zhengqing Liu, Ziyue Jiang, Xize Cheng, Siqi Zheng, Jin Xu, Junyang Lin, Zhou Zhao
•
May 14, 2025
•
4
2
Omni-R1: 오디오 LLM을 미세 조정하려면 정말 오디오가 필요한가?
Omni-R1: Do You Really Need Audio to Fine-Tune Your Audio LLM?
Andrew Rouditchenko, Saurabhchand Bhati, Edson Araujo, Samuel Thomas, Hilde Kuehne, Rogerio Feris, James Glass
•
May 14, 2025
•
4
1
VCRBench: 대형 비디오 언어 모델의 장편 인과 추론 능력 탐구
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models
Pritam Sarkar, Ali Etemad
•
May 13, 2025
•
4
1
DetReIDX: 실세계 UAV 기반 인물 인식을 위한 스트레스 테스트 데이터셋
DetReIDX: A Stress-Test Dataset for Real-World UAV-Based Person Recognition
Kailash A. Hambarde, Nzakiese Mbongo, Pavan Kumar MP, Satish Mekewad, Carolina Fernandes, Gökhan Silahtaroğlu, Alice Nithya, Pawan Wasnik, MD. Rashidunnabi, Pranita Samale, Hugo Proença
•
May 7, 2025
•
2
1
시각적 질의응답을 위한 시각적으로 해석 가능한 하위 작업 추론
Visually Interpretable Subtask Reasoning for Visual Question Answering
Yu Cheng, Arushi Goel, Hakan Bilen
•
May 12, 2025
•
1
1
LightLab: 확산 모델을 활용한 이미지 내 광원 제어
LightLab: Controlling Light Sources in Images with Diffusion Models
Nadav Magar, Amir Hertz, Eric Tabellion, Yael Pritch, Alex Rav-Acha, Ariel Shamir, Yedid Hoshen
•
May 14, 2025
•
0
1
Maya의 배경: 다국어 비전 언어 모델 구축
Behind Maya: Building a Multilingual Vision Language Model
Nahid Alam, Karthik Reddy Kanjula, Surya Guthikonda, Timothy Chung, Bala Krishna S Vegesna, Abhipsha Das, Anthony Susevski, Ryan Sze-Yin Chan, S M Iftekhar Uddin, Shayekh Bin Islam, Roshan Santhosh, Snegha A, Drishti Sharma, Chen Liu, Isha Chaturvedi, Genta Indra Winata, Ashvanth. S, Snehanshu Mukherjee, Alham Fikri Aji
•
May 13, 2025
•
0
1
이미지-텍스트 사전 학습 데이터셋의 유해성 이해 및 완화: LLaVA 사례 연구
Understanding and Mitigating Toxicity in Image-Text Pretraining Datasets: A Case Study on LLaVA
Karthik Reddy Kanjula, Surya Guthikonda, Nahid Alam, Shayekh Bin Islam
•
May 9, 2025
•
0
1
컴팩트 3D 가우시안 스플래팅을 위한 최급강하 밀도 제어
Steepest Descent Density Control for Compact 3D Gaussian Splatting
Peihao Wang, Yuehao Wang, Dilin Wang, Sreyas Mohan, Zhiwen Fan, Lemeng Wu, Ruisi Cai, Yu-Ying Yeh, Zhangyang Wang, Qiang Liu, Rakesh Ranjan
•
May 8, 2025
•
0
1