CoTox: Ketten-der-Gedanken-basiertes molekulares Toxizitätsreasoning und -vorhersage
CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction
August 5, 2025
papers.authors: Jueon Park, Yein Park, Minju Song, Soyon Park, Donghyeon Lee, Seungheun Baek, Jaewoo Kang
cs.AI
papers.abstract
Die Toxizität von Arzneimitteln bleibt eine große Herausforderung in der pharmazeutischen Entwicklung. Aktuelle maschinelle Lernmodelle haben die in silico-Toxizitätsvorhersage verbessert, doch ihre Abhängigkeit von annotierten Daten und mangelnde Interpretierbarkeit schränken ihre Anwendbarkeit ein. Dies begrenzt ihre Fähigkeit, organspezifische Toxizitäten zu erfassen, die durch komplexe biologische Mechanismen verursacht werden. Große Sprachmodelle (LLMs) bieten eine vielversprechende Alternative durch schrittweises Denken und die Integration von Textdaten, doch bisherige Ansätze fehlt es an biologischem Kontext und transparenter Begründung. Um dieses Problem zu lösen, schlagen wir CoTox vor, ein neuartiges Framework, das LLM mit Chain-of-Thought (CoT)-Denken für die Vorhersage von Multi-Toxizität kombiniert. CoTox integriert chemische Strukturdaten, biologische Pfade und Gene-Ontology (GO)-Begriffe, um interpretierbare Toxizitätsvorhersagen durch schrittweises Denken zu generieren. Mit GPT-4o zeigen wir, dass CoTox sowohl traditionelle maschinelle Lernmodelle als auch Deep-Learning-Modelle übertrifft. Wir untersuchen weiterhin seine Leistung über verschiedene LLMs hinweg, um zu identifizieren, wo CoTox am effektivsten ist. Zusätzlich stellen wir fest, dass die Darstellung chemischer Strukturen mit IUPAC-Namen, die für LLMs leichter zu verstehen sind als SMILES, die Denkfähigkeit des Modells verbessert und die Vorhersageleistung steigert. Um den praktischen Nutzen in der Arzneimittelentwicklung zu demonstrieren, simulieren wir die Behandlung relevanter Zelltypen mit einem Wirkstoff und integrieren den daraus resultierenden biologischen Kontext in das CoTox-Framework. Dieser Ansatz ermöglicht es CoTox, Toxizitätsvorhersagen zu generieren, die mit physiologischen Reaktionen übereinstimmen, wie in einer Fallstudie gezeigt wird. Dieses Ergebnis unterstreicht das Potenzial von LLM-basierten Frameworks, die Interpretierbarkeit zu verbessern und die Sicherheitsbewertung von Arzneimitteln in frühen Entwicklungsstadien zu unterstützen. Der Code und die verwendeten Prompts sind unter https://github.com/dmis-lab/CoTox verfügbar.
English
Drug toxicity remains a major challenge in pharmaceutical development. Recent
machine learning models have improved in silico toxicity prediction, but their
reliance on annotated data and lack of interpretability limit their
applicability. This limits their ability to capture organ-specific toxicities
driven by complex biological mechanisms. Large language models (LLMs) offer a
promising alternative through step-by-step reasoning and integration of textual
data, yet prior approaches lack biological context and transparent rationale.
To address this issue, we propose CoTox, a novel framework that integrates LLM
with chain-of-thought (CoT) reasoning for multi-toxicity prediction. CoTox
combines chemical structure data, biological pathways, and gene ontology (GO)
terms to generate interpretable toxicity predictions through step-by-step
reasoning. Using GPT-4o, we show that CoTox outperforms both traditional
machine learning and deep learning model. We further examine its performance
across various LLMs to identify where CoTox is most effective. Additionally, we
find that representing chemical structures with IUPAC names, which are easier
for LLMs to understand than SMILES, enhances the model's reasoning ability and
improves predictive performance. To demonstrate its practical utility in drug
development, we simulate the treatment of relevant cell types with drug and
incorporated the resulting biological context into the CoTox framework. This
approach allow CoTox to generate toxicity predictions aligned with
physiological responses, as shown in case study. This result highlights the
potential of LLM-based frameworks to improve interpretability and support
early-stage drug safety assessment. The code and prompt used in this work are
available at https://github.com/dmis-lab/CoTox.