ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
July 30th, 2024
SaulLM-54B y SaulLM-141B: Ampliando la Adaptación de Dominio para el Dominio Legal
SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain
Pierre Colombo, Telmo Pires, Malik Boudiaf, Rui Melo, Dominic Culver, Sofia Morgado, Etienne Malaboeuf, Gabriel Hautreux, Johanne Charpentier, Michael Desa
•
Jul 28, 2024
•
66
2
Integración de Modelos de Lenguaje Grandes en una Arquitectura Tri-Modal para la Clasificación Automatizada de la Depresión
Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification
Santosh V. Patapati
•
Jul 27, 2024
•
59
9
SeaLLMs 3: Fundación Abierta y Modelos de Lenguaje de Gran Tamaño Multilingües de Chat para Idiomas del Sudeste Asiático
SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages
Wenxuan Zhang, Hou Pong Chan, Yiran Zhao, Mahani Aljunied, Jianyu Wang, Chaoqun Liu, Yue Deng, Zhiqiang Hu, Weiwen Xu, Yew Ken Chia, Xin Li, Lidong Bing
•
Jul 29, 2024
•
58
6
FreeLong: Generación de videos largos sin entrenamiento con Atención Temporal SpectralBlend.
FreeLong: Training-Free Long Video Generation with SpectralBlend Temporal Attention
Yu Lu, Yuanzhi Liang, Linchao Zhu, Yi Yang
•
Jul 29, 2024
•
52
2
Theia: Destilando Modelos Fundamentales de Visión Diversos para el Aprendizaje de Robots
Theia: Distilling Diverse Vision Foundation Models for Robot Learning
Jinghuan Shang, Karl Schmeckpeper, Brandon B. May, Maria Vittoria Minniti, Tarik Kelestemur, David Watkins, Laura Herlant
•
Jul 29, 2024
•
48
3
MindSearch: Imitar las mentes humanas provoca una profunda búsqueda de IA.
MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao
•
Jul 29, 2024
•
44
4
MMAU: Una Evaluación Integral de las Capacidades de Agentes en Diversos Dominios
MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains
Guoli Yin, Haoping Bai, Shuang Ma, Feng Nan, Yanchao Sun, Zhaoyang Xu, Shen Ma, Jiarui Lu, Xiang Kong, Aonan Zhang, Dian Ang Yap, Yizhe zhang, Karsten Ahnert, Vik Kamath, Mathias Berglund, Dominic Walsh, Tobias Gindele, Juergen Wiest, Zhengfeng Lai, Xiaoming Wang, Jiulong Shan, Meng Cao, Ruoming Pang, Zirui Wang
•
Jul 18, 2024
•
41
4
La retroalimentación por difusión ayuda a CLIP a ver mejor.
Diffusion Feedback Helps CLIP See Better
Wenxuan Wang, Quan Sun, Fan Zhang, Yepeng Tang, Jing Liu, Xinlong Wang
•
Jul 29, 2024
•
37
2
Mezcla de Expertos Anidados: Procesamiento Adaptativo de Tokens Visuales
Mixture of Nested Experts: Adaptive Processing of Visual Tokens
Gagan Jain, Nidhi Hegde, Aditya Kusupati, Arsha Nagrani, Shyamal Buch, Prateek Jain, Anurag Arnab, Sujoy Paul
•
Jul 29, 2024
•
37
4
El Autoentrenamiento con Optimización Directa de Preferencias Mejora el Razonamiento en Cadena de Pensamiento.
Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning
Tianduo Wang, Shichen Li, Wei Lu
•
Jul 25, 2024
•
34
4
Cycle3D: Generación de Imágenes a 3D de Alta Calidad y Consistente a través del Ciclo Generación-Reconstrucción
Cycle3D: High-quality and Consistent Image-to-3D Generation via Generation-Reconstruction Cycle
Zhenyu Tang, Junwu Zhang, Xinhua Cheng, Wangbo Yu, Chaoran Feng, Yatian Pang, Bin Lin, Li Yuan
•
Jul 28, 2024
•
28
2
Acertijos Visuales: un Desafío de Sentido Común y Conocimiento del Mundo para Modelos de Visión y Lenguaje a Gran Escala
Visual Riddles: a Commonsense and World Knowledge Challenge for Large Vision and Language Models
Nitzan Bitton-Guetta, Aviv Slobodkin, Aviya Maimon, Eliya Habba, Royi Rassin, Yonatan Bitton, Idan Szpektor, Amir Globerson, Yuval Elovici
•
Jul 28, 2024
•
23
2
Respuesta a preguntas en 3D para la comprensión de escenas urbanas
3D Question Answering for City Scene Understanding
Penglei Sun, Yaoxian Song, Xiang Liu, Xiaofei Yang, Qiang Wang, Tiefeng Li, Yang Yang, Xiaowen Chu
•
Jul 24, 2024
•
22
5
ATHAR: Un conjunto de datos de alta calidad y diverso para la traducción de árabe clásico a inglés.
ATHAR: A High-Quality and Diverse Dataset for Classical Arabic to English Translation
Mohammed Khalil, Mohammed Sabry
•
Jul 29, 2024
•
21
1
Modelos de Lenguaje Meta-Recompensantes: Alineación Auto-Mejorante con LLM como Meta-Juez
Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge
Tianhao Wu, Weizhe Yuan, Olga Golovneva, Jing Xu, Yuandong Tian, Jiantao Jiao, Jason Weston, Sainbayar Sukhbaatar
•
Jul 28, 2024
•
21
2
ImagiNet: Un conjunto de datos multi-contenido para la detección de imágenes sintéticas generalizable a través del aprendizaje por contraste.
ImagiNet: A Multi-Content Dataset for Generalizable Synthetic Image Detection via Contrastive Learning
Delyan Boychev, Radostin Cholakov
•
Jul 29, 2024
•
20
2
Análisis de Sentimientos de Reseñas en Línea en Lituano Utilizando Modelos de Lenguaje Grandes
Sentiment Analysis of Lithuanian Online Reviews Using Large Language Models
Brigita Vileikytė, Mantas Lukoševičius, Lukas Stankevičius
•
Jul 29, 2024
•
12
1
Cerrando la Brecha: Creación de Avatares tipo Estudio a partir de una Captura Monocular de Teléfono
Bridging the Gap: Studio-like Avatar Creation from a Monocular Phone Capture
ShahRukh Athar, Shunsuke Saito, Zhengyu Yang, Stanislav Pidhorsky, Chen Cao
•
Jul 28, 2024
•
12
1
WalkTheDog: Alineación de Movimiento Cruzado de Morfología a través de Manifolds de Fase
WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds
Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
•
Jul 11, 2024
•
12
2
VolDoGer: Conjuntos de datos asistidos por LLM para Generalización de Dominio en Tareas de Visión-Lenguaje
VolDoGer: LLM-assisted Datasets for Domain Generalization in Vision-Language Tasks
Juhwan Choi, Junehyoung Kwon, JungMin Yun, Seunguk Yu, YoungBin Kim
•
Jul 29, 2024
•
11
3
TAPTRv2: Actualización de Posición basada en Atención Mejora el Seguimiento de Cualquier Punto
TAPTRv2: Attention-based Position Update Improves Tracking Any Point
Hongyang Li, Hao Zhang, Shilong Liu, Zhaoyang Zeng, Feng Li, Tianhe Ren, Bohan Li, Lei Zhang
•
Jul 23, 2024
•
11
4