ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
August 7th, 2024
LLM 테스트 시간 계산을 최적화하는 것이 모델 매개변수를 확장하는 것보다 더 효과적일 수 있습니다.
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters
Charlie Snell, Jaehoon Lee, Kelvin Xu, Aviral Kumar
•
Aug 6, 2024
•
63
3
대규모 시각-언어 모델 평가를 위한 다중 모달 다중 이미지 이해(MMIU)
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models
Fanqing Meng, Jin Wang, Chuanhao Li, Quanfeng Lu, Hao Tian, Jiaqi Liao, Xizhou Zhu, Jifeng Dai, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao
•
Aug 5, 2024
•
62
3
LLaVA-OneVision: 쉬운 시각 작업 이전
LLaVA-OneVision: Easy Visual Task Transfer
Bo Li, Yuanhan Zhang, Dong Guo, Renrui Zhang, Feng Li, Hao Zhang, Kaichen Zhang, Yanwei Li, Ziwei Liu, Chunyuan Li
•
Aug 6, 2024
•
61
2
객체는 64x64 픽셀의 가치가 있다: 이미지 확산을 통한 3D 객체 생성
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion
Xingguang Yan, Han-Hung Lee, Ziyu Wan, Angel X. Chang
•
Aug 6, 2024
•
41
3
MedTrinity-25M: 의학을 위한 다중계층 주석이 포함된 대규모 다중모달 데이터셋
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine
Yunfei Xie, Ce Zhou, Lang Gao, Juncheng Wu, Xianhang Li, Hong-Yu Zhou, Sheng Liu, Lei Xing, James Zou, Cihang Xie, Yuyin Zhou
•
Aug 6, 2024
•
30
2
IPAdapter-Instruct: 이미지 기반 조건부에서 모호성 해결을 위한 Instruct 프롬프트
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
Ciara Rowles, Shimon Vainer, Dante De Nigris, Slava Elizarov, Konstantin Kutsy, Simon Donné
•
Aug 6, 2024
•
23
2
CoverBench: 복잡한 주장 검증을 위한 도전적인 벤치마크
CoverBench: A Challenging Benchmark for Complex Claim Verification
Alon Jacovi, Moran Ambar, Eyal Ben-David, Uri Shaham, Amir Feder, Mor Geva, Dror Marcus, Avi Caciularu
•
Aug 6, 2024
•
15
2
확산 모델로서의 데이터 마이닝 도구
Diffusion Models as Data Mining Tools
Ioannis Siglidis, Aleksander Holynski, Alexei A. Efros, Mathieu Aubry, Shiry Ginosar
•
Jul 20, 2024
•
14
2
ReSyncer: 통합 오디오-시각적으로 동기화된 얼굴 퍼포머를 위한 스타일 기반 생성기 다시 연결
ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer
Jiazhi Guan, Zhiliang Xu, Hang Zhou, Kaisiyuan Wang, Shengyi He, Zhanwang Zhang, Borong Liang, Haocheng Feng, Errui Ding, Jingtuo Liu, Jingdong Wang, Youjian Zhao, Ziwei Liu
•
Aug 6, 2024
•
11
2
약한 LLM과 강한 LLM에서 텍스트-SQL 데이터를 합성하기
Synthesizing Text-to-SQL Data from Weak and Strong LLMs
Jiaxi Yang, Binyuan Hui, Min Yang, Jian Yang, Junyang Lin, Chang Zhou
•
Aug 6, 2024
•
11
2
StructEval: 구조화된 평가를 통해 대규모 언어 모델 평가를 심화하고 확장하기
StructEval: Deepen and Broaden Large Language Model Assessment via Structured Evaluation
Boxi Cao, Mengjie Ren, Hongyu Lin, Xianpei Han, Feng Zhang, Junfeng Zhan, Le Sun
•
Aug 6, 2024
•
10
2
AVESFormer: 실시간 오디오-비주얼 세분화를 위한 효율적인 트랜스포머 디자인
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation
Zili Wang, Qi Yang, Linsu Shi, Jiazhong Yu, Qinghua Liang, Fei Li, Shiming Xiang
•
Aug 3, 2024
•
4
2