ChatPaper.ai
메뉴 열기
홈
오늘의 논문
arXiv
HuggingFace
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
June 21st, 2024
nabla^2DFT: 신약 후보 물질의 보편적 양자 화학 데이터셋 및 신경망 포텐셜 벤치마크
nabla^2DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials
Kuzma Khrabrov, Anton Ber, Artem Tsypin, Konstantin Ushenin, Egor Rumiantsev, Alexander Telepov, Dmitry Protasov, Ilya Shenbin, Anton Alekseev, Mikhail Shirokikh, Sergey Nikolenko, Elena Tutubalina, Artur Kadurin
•
Jun 20, 2024
•
102
4
지시 사전 학습: 언어 모델은 지도 다중 작업 학습자입니다
Instruction Pre-Training: Language Models are Supervised Multitask Learners
Daixuan Cheng, Yuxian Gu, Shaohan Huang, Junyu Bi, Minlie Huang, Furu Wei
•
Jun 20, 2024
•
94
25
악마는 디테일에 있다: 디테일이 풍부한 StyleGAN 인버전과 고품질 이미지 편집을 위한 StyleFeatureEditor
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing
Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov
•
Jun 15, 2024
•
70
2
HARE: 소형 언어 모델 효율성의 열쇠, 인간 사전 지식
HARE: HumAn pRiors, a key to small language model Efficiency
Lingyun Zhang, Bin jin, Gaojian Ge, Lunhui Liu, Xuewen Shen, Mingyong Wu, Houqian Zhang, Yongneng Jiang, Shiqi Chen, Shi Pu
•
Jun 17, 2024
•
40
1
Prism: 시각-언어 모델의 능력을 분리하고 평가하기 위한 프레임워크
Prism: A Framework for Decoupling and Assessing the Capabilities of VLMs
Yuxuan Qiao, Haodong Duan, Xinyu Fang, Junming Yang, Lin Chen, Songyang Zhang, Jiaqi Wang, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
36
2
MMBench-Video: 통합적 비디오 이해를 위한 장편 멀티샷 벤치마크
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding
Xinyu Fang, Kangrui Mao, Haodong Duan, Xiangyu Zhao, Yining Li, Dahua Lin, Kai Chen
•
Jun 20, 2024
•
34
1
모델 병합과 안전성 정렬: 하나의 나쁜 모델이 전체를 망친다
Model Merging and Safety Alignment: One Bad Model Spoils the Bunch
Hasan Abed Al Kader Hammoud, Umberto Michieli, Fabio Pizzati, Philip Torr, Adel Bibi, Bernard Ghanem, Mete Ozay
•
Jun 20, 2024
•
31
1
화이트보드-오브-생각: 다중 모달리티 간 단계별 사고
Whiteboard-of-Thought: Thinking Step-by-Step Across Modalities
Sachit Menon, Richard Zemel, Carl Vondrick
•
Jun 20, 2024
•
29
1
약 7단계 내 텍스트 기반 이미지 편집을 위한 가역적 일관성 증류
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps
Nikita Starodubcev, Mikhail Khoroshikh, Artem Babenko, Dmitry Baranchuk
•
Jun 20, 2024
•
28
1
GLiNER 멀티태스크: 다양한 정보 추출 작업을 위한 범용 경량 모델
GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks
Ihor Stepanov, Mykhailo Shtopko
•
Jun 14, 2024
•
26
3
PIN: 페어링 및 인터리브된 멀티모달 문서를 위한 지식 집약적 데이터셋
PIN: A Knowledge-Intensive Dataset for Paired and Interleaved Multimodal Documents
Junjie Wang, Yin Zhang, Yatai Ji, Yuxiang Zhang, Chunyang Jiang, Yubo Wang, Kang Zhu, Zekun Wang, Tiezhen Wang, Wenhao Huang, Jie Fu, Bei Chen, Qunshu Lin, Minghao Liu, Ge Zhang, Wenhu Chen
•
Jun 20, 2024
•
23
1
DigiRL: 자율 강화 학습을 통한 실환경 디바이스 제어 에이전트 훈련
DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning
Hao Bai, Yifei Zhou, Mert Cemri, Jiayi Pan, Alane Suhr, Sergey Levine, Aviral Kumar
•
Jun 14, 2024
•
20
1
실행 피드백을 통한 자기 대전: 대규모 언어 모델의 명령어 수행 능력 향상
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models
Guanting Dong, Keming Lu, Chengpeng Li, Tingyu Xia, Bowen Yu, Chang Zhou, Jingren Zhou
•
Jun 19, 2024
•
16
2
LiveMind: 동시 추론을 통한 저지연 대규모 언어 모델
LiveMind: Low-latency Large Language Models with Simultaneous Inference
Chuangtao Chen, Grace Li Zhang, Xunzhao Yin, Cheng Zhuo, Ulf Schlichtmann, Bing Li
•
Jun 20, 2024
•
14
4
다중 이미지 생성을 통한 언어 모델의 시각적 상식 향상
Improving Visual Commonsense in Language Models via Multiple Image Generation
Guy Yariv, Idan Schwartz, Yossi Adi, Sagie Benaim
•
Jun 19, 2024
•
13
2
반복적 길이 정규화 직접 선호 최적화: 7B 언어 모델을 GPT-4 수준으로 개선하는 사례 연구
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level
Jie Liu, Zhanhui Zhou, Jiaheng Liu, Xingyuan Bu, Chao Yang, Han-Sen Zhong, Wanli Ouyang
•
Jun 17, 2024
•
13
1
REPOEXEC: 저장소 수준 실행 가능 벤치마크를 통한 코드 생성 평가
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark
Nam Le Hai, Dung Manh Nguyen, Nghi D. Q. Bui
•
Jun 17, 2024
•
11
1
ExVideo: 파라미터 효율적 사후 튜닝을 통한 비디오 확산 모델 확장
ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning
Zhongjie Duan, Wenmeng Zhou, Cen Chen, Yaliang Li, Weining Qian
•
Jun 20, 2024
•
10
3
τ-bench: 실세계 도메인에서의 도구-에이전트-사용자 상호작용을 위한 벤치마크
τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains
Shunyu Yao, Noah Shinn, Pedram Razavi, Karthik Narasimhan
•
Jun 17, 2024
•
8
3
신뢰할 수 있는 검색 증강 생성(Retrieval-Augmented Generation)을 위한 모델 내부 기반 답변 귀속
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation
Jirui Qi, Gabriele Sarti, Raquel Fernández, Arianna Bisazza
•
Jun 19, 2024
•
7
1
StableSemantics: 자연주의적 이미지에서의 의미 표현을 담은 합성 언어-비전 데이터셋
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images
Rushikesh Zawar, Shaurya Dewan, Andrew F. Luo, Margaret M. Henderson, Michael J. Tarr, Leila Wehbe
•
Jun 19, 2024
•
5
1
통찰에서 행동으로: 해석 가능성과 분석의 영향 자연어 처리 연구
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP
Marius Mosbach, Vagrant Gautam, Tomás Vergara-Browne, Dietrich Klakow, Mor Geva
•
Jun 18, 2024
•
5
1
텍스트 요약에 대한 체계적 조사: 통계적 방법부터 대규모 언어 모델까지
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models
Haopeng Zhang, Philip S. Yu, Jiawei Zhang
•
Jun 17, 2024
•
5
2
잠재 확산 모델을 이용한 3D 가우시안 장면 초 단위 샘플링
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models
Paul Henderson, Melonie de Almeida, Daniela Ivanova, Titas Anciukevičius
•
Jun 18, 2024
•
4
1