Является ли GPT-4 хорошим аналитиком данных?

Аннотация

Поскольку крупные языковые модели (LLM) продемонстрировали свои мощные возможности в различных областях и задачах, включая понимание контекста, генерацию кода, создание текста, визуализацию данных и т.д., многие аналитики данных могут задаваться вопросом, будут ли их работы заменены искусственным интеллектом. Эта спорная тема привлекла значительное внимание общественности. Однако мы все еще находимся на этапе расхождения мнений без какого-либо окончательного вывода. Вдохновленные этим, мы ставим исследовательский вопрос: «Является ли GPT-4 хорошим аналитиком данных?» — и стремимся ответить на него, проводя сравнительные исследования. В частности, мы рассматриваем GPT-4 как аналитика данных, выполняющего сквозной анализ данных с использованием баз данных из различных областей. Мы предлагаем подход к решению проблем, тщательно разрабатывая промты для GPT-4 для проведения экспериментов. Также мы разрабатываем несколько специфических метрик оценки для систематического сравнения производительности нескольких профессиональных аналитиков данных и GPT-4. Результаты экспериментов показывают, что GPT-4 может достичь сопоставимой с людьми производительности. Мы также предоставляем подробное обсуждение наших результатов, чтобы пролить свет на дальнейшие исследования, прежде чем прийти к выводу, что GPT-4 может заменить аналитиков данных.

English

As large language models (LLMs) have demonstrated their powerful capabilities in plenty of domains and tasks, including context understanding, code generation, language generation, data storytelling, etc., many data analysts may raise concerns if their jobs will be replaced by AI. This controversial topic has drawn a lot of attention in public. However, we are still at a stage of divergent opinions without any definitive conclusion. Motivated by this, we raise the research question of "is GPT-4 a good data analyst?" in this work and aim to answer it by conducting head-to-head comparative studies. In detail, we regard GPT-4 as a data analyst to perform end-to-end data analysis with databases from a wide range of domains. We propose a framework to tackle the problems by carefully designing the prompts for GPT-4 to conduct experiments. We also design several task-specific evaluation metrics to systematically compare the performance between several professional human data analysts and GPT-4. Experimental results show that GPT-4 can achieve comparable performance to humans. We also provide in-depth discussions about our results to shed light on further studies before we reach the conclusion that GPT-4 can replace data analysts.

Является ли GPT-4 хорошим аналитиком данных?

Is GPT-4 a Good Data Analyst?

Аннотация

Support