ChatPaper.ai
Abrir menú
Inicio
Artículos Diarios
arXiv
HuggingFace
Precios
Cuenta
Espacio de trabajo
🇪🇸
Español
Loading...
•
•
•
•
•
•
•
•
•
•
Artículos de Investigación en IA Diarios
Artículos de investigación en IA seleccionados diariamente con traducciones
November 1st, 2024
Autoalineación de Código: Autoalineación para la Generación de Código
SelfCodeAlign: Self-Alignment for Code Generation
Yuxiang Wei, Federico Cassano, Jiawei Liu, Yifeng Ding, Naman Jain, Zachary Mueller, Harm de Vries, Leandro von Werra, Arjun Guha, Lingming Zhang
•
Oct 31, 2024
•
25
2
Los modelos de lenguaje pueden alargarse automáticamente para generar textos largos.
Language Models can Self-Lengthen to Generate Long Texts
Shanghaoran Quan, Tianyi Tang, Bowen Yu, An Yang, Dayiheng Liu, Bofei Gao, Jianhong Tu, Yichang Zhang, Jingren Zhou, Junyang Lin
•
Oct 31, 2024
•
18
3
AAAR-1.0: Evaluación del Potencial de la IA para Asistir en la Investigación
AAAR-1.0: Assessing AI's Potential to Assist Research
Renze Lou, Hanzi Xu, Sijia Wang, Jiangshu Du, Ryo Kamoi, Xiaoxin Lu, Jian Xie, Yuxuan Sun, Yusen Zhang, Jihyun Janice Ahn, Hongchao Fang, Zhuoyang Zou, Wenchao Ma, Xi Li, Kai Zhang, Congying Xia, Lifu Huang, Wenpeng Yin
•
Oct 29, 2024
•
16
3
NeuZip: Entrenamiento e Inferencia Eficientes en Memoria con Compresión Dinámica de Redes Neuronales
NeuZip: Memory-Efficient Training and Inference with Dynamic Compression of Neural Networks
Yongchang Hao, Yanshuai Cao, Lili Mou
•
Oct 28, 2024
•
17
2
Enseñanza de Agentes de Aprendizaje por Refuerzo Incorporado: Informatividad y Diversidad en el Uso del Lenguaje
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use
Jiajun Xi, Yinong He, Jianing Yang, Yinpei Dai, Joyce Chai
•
Oct 31, 2024
•
6
2
La Retrotraducción de Restricciones Mejora el Seguimiento de Instrucciones Complejas por Parte de Modelos de Lenguaje Grandes
Constraint Back-translation Improves Complex Instruction Following of Large Language Models
Yunjia Qi, Hao Peng, Xiaozhi Wang, Bin Xu, Lei Hou, Juanzi Li
•
Oct 31, 2024
•
18
2
Navegando por lo Desconocido: Una Interfaz Colaborativa Basada en Chat para Tareas Exploratorias Personalizadas
Navigating the Unknown: A Chat-Based Collaborative Interface for Personalized Exploratory Tasks
Yingzhe Peng, Xiaoting Qin, Zhiyang Zhang, Jue Zhang, Qingwei Lin, Xu Yang, Dongmei Zhang, Saravan Rajmohan, Qi Zhang
•
Oct 31, 2024
•
10
2
BitStack: Control Fino del Tamaño a Nivel de Bits para Modelos de Lenguaje Grandes Comprimidos en Entornos de Memoria Variable
BitStack: Fine-Grained Size Control for Compressed Large Language Models in Variable Memory Environments
Xinghao Wang, Pengyu Wang, Bo Wang, Dong Zhang, Yunhua Zhou, Xipeng Qiu
•
Oct 31, 2024
•
20
6
BenchX: Un marco de referencia unificado para la evaluación de preentrenamiento de visión y lenguaje médico en radiografías de tórax.
BenchX: A Unified Benchmark Framework for Medical Vision-Language Pretraining on Chest X-Rays
Yang Zhou, Tan Li Hui Faith, Yanyu Xu, Sicong Leng, Xinxing Xu, Yong Liu, Rick Siow Mong Goh
•
Oct 29, 2024
•
10
2
Acoplamiento de Entropía Mínima con Cuello de Botella
Minimum Entropy Coupling with Bottleneck
M. Reza Ebrahimi, Jun Chen, Ashish Khisti
•
Oct 29, 2024
•
5
2
Qué Sucedió en las Capas de LLMs al Ser Entrenadas para Pensamiento Rápido vs. Lento: Una Perspectiva de Gradiente
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective
Ming Li, Yanhong Li, Tianyi Zhou
•
Oct 31, 2024
•
64
4
GlotCC: Un corpus y un conjunto de herramientas de procesamiento para CommonCrawl de amplia cobertura y abierto para idiomas minoritarios
GlotCC: An Open Broad-Coverage CommonCrawl Corpus and Pipeline for Minority Languages
Amir Hossein Kargaran, François Yvon, Hinrich Schütze
•
Oct 31, 2024
•
4
2
Un enfoque basado en redes de punteros para la extracción conjunta y detección de intenciones multietiqueta y multiclase.
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents
Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
•
Oct 29, 2024
•
29
3
Desempaquetando SDXL Turbo: Interpretando modelos de texto a imagen con autoencoders dispersos.
Unpacking SDXL Turbo: Interpreting Text-to-Image Models with Sparse Autoencoders
Viacheslav Surkov, Chris Wendler, Mikhail Terekhov, Justin Deschenaux, Robert West, Caglar Gulcehre
•
Oct 28, 2024
•
83
3
Aprendizaje de Representaciones de Video sin Videos Naturales
Learning Video Representations without Natural Videos
Xueyang Yu, Xinlei Chen, Yossi Gandelsman
•
Oct 31, 2024
•
16
2
DELTA: Seguimiento 3D Denso, Eficiente y de Largo Alcance para cualquier video
DELTA: Dense Efficient Long-range 3D Tracking for any video
Tuan Duc Ngo, Peiye Zhuang, Chuang Gan, Evangelos Kalogerakis, Sergey Tulyakov, Hsin-Ying Lee, Chaoyang Wang
•
Oct 31, 2024
•
9
2