Kostenmodellierung klinischer Studien mit NLP und KI

Modellierung von Risiken und Kosten in klinischen Studien mit NLP

Risikotool für klinische Studien von Fast Data Science

Klinische Studien sind ein wesentlicher Bestandteil der Markteinführung neuer Medikamente, doch ihre Planung und Durchführung kann ein komplexer und kostspieliger Prozess sein. Ein wesentlicher Teil dieser Planung ist die genaue Einschätzung der Kosten und Risiken einer Studie. Traditionell war hierfür ein Expertenteam erforderlich, das lange, oft Hunderte von Seiten umfassende Protokolle klinischer Studien manuell durchging.

Fast Data Science entwickelt das Clinical Trial Risk Tool weiter, ein NLP-Modell, das die Verarbeitung natürlicher Sprache (NLP) nutzt, um Protokolle klinischer Studien zu analysieren und automatisch entscheidende Kosten- und Risikofaktoren zu extrahieren.

Protokolle für klinische Studien

Ein klinisches Studienprotokoll ist ein wichtiger Bestandteil der Durchführung einer Studie und wird vor Beginn der klinischen Studie erstellt. Es handelt sich dabei um ein langes Dokument, das oft etwa 200 Seiten lang und im PDF-Format ist. Studienprotokolle beschreiben die Ziele und das Design einer Studie, liefern die Gründe und den Hintergrund für die Studie und müssen Standards erfüllen, die den Grundsätzen guter klinischer Praxis entsprechen.

Die Kosten oder das Risiko einer klinischen Studie abzuschätzen, ist ein schwieriges Problem, da es sich um eine Geschäftsbewertung handelt, die ein Expertenteam erfordert, das das Protokoll gründlich lesen muss. Dies geschieht in der Regel manuell in Pharmaunternehmen , Finanzierungsorganisationen oder Auftragsforschungsinstituten (CROs). Die Protokolle sind in der Regel in komplexer, hochspezialisierter Sprache verfasst, sind aber grundsätzlich in natürlicher Sprache und nicht in einem strukturierten oder tabellarischen Format. Dies macht das Problem zu einem idealen Feld für KI und NLP im Gesundheitswesen .

Was ist NLP und wie funktioniert es?

Die Verarbeitung natürlicher Sprache (NLP) ist das Teilgebiet der KI, das sich damit beschäftigt, Computern das Verstehen und Verarbeiten menschlicher Sprache zu ermöglichen. Das Clinical Trial Risk Tool verwendet NLP, um Protokolle klinischer Studien zu „lesen“ und wichtige Informationen wie die Art der Behandlung, den untersuchten Zustand (Pathologie) und die erforderliche Teilnehmerzahl zu extrahieren. Diese extrahierten Daten werden dann verwendet, um potenzielle Risiken und Kosten im Zusammenhang mit der Studie abzuschätzen.

Estimate the risk or cost of a clinical trial

Try the Clinical Trial Risk Tool

Sie können die kostenlose (HIV/TB) Version des Tools ausprobieren, die online unter https://app.clinicaltrialrisk.org/ verfügbar ist, und Sie können uns kontaktieren, um unsere laufende Arbeit zur Kosten-/Risikomodellierung für andere Pathologien zu besprechen.

Try the tool

Vorteile des Clinical Trial Risk Tools

Schnellere und effizientere Planung: Durch die Automatisierung der Analyse langer Protokolle spart das Clinical Trial Risk Tool Unternehmen und Organisationen in der Planungsphase einer Studie viel Zeit und Ressourcen.
Verbesserte Kostenschätzung: Durch das Extrahieren wichtiger Faktoren aus dem Protokoll ist eine genauere Vorhersage der Versuchskosten möglich, was zu einer besseren Budgetierung und Ressourcenzuweisung führt.
Geringeres Risiko: Durch die frühzeitige Erkennung potenzieller Risiken im Planungsprozess können Minderungsstrategien entwickelt und so die Wahrscheinlichkeit kostspieliger Verzögerungen oder Ausfälle verringert werden.

Open Source und kollaborative Entwicklung

Die erste Version des Clinical Trial Risk Tool, die sich auf HIV- und TB-Studien in Ländern mit niedrigem und mittlerem Einkommen konzentriert, ist vollständig Open Source. Dies ermöglicht die Zusammenarbeit und Weiterentwicklung durch die breitere wissenschaftliche Gemeinschaft.

Fast Data Science sucht aktiv nach Partnern in der Pharmaindustrie, wie etwa Geldgebern, Pharmaunternehmen, MedTech, Forschungsorganisationen und CROs, um die Fähigkeiten des Tools zu erweitern und ein breiteres Spektrum an Pathologien, Testphasen und Interventionsarten abzudecken. Eine große Herausforderung ist der Zugang zu vertraulichen Industriedaten zu den Kosten von Studien, da viele Protokolle nicht öffentlich auf Repositorien wie ClinicalTrials.gov oder EudraCT verfügbar sind und Kostendaten normalerweise nicht veröffentlicht werden.

Sie können den Quellcode unter https://github.com/fastdatascience/clinical_trial_risk herunterladen und ausführen.

Die Zukunft der Kostenmodellierung klinischer Studien

Fast Data Science verbessert das Clinical Trial Risk Tool ständig, einschließlich der Entwicklung von Regressionsmodellen zur Vorhersage der Kosten einer Studie auf Basis historischer Daten. Diese Kombination aus NLP und maschinellem Lernen ist vielversprechend für die Optimierung der Planung klinischer Studien, die Kostensenkung und letztlich die Beschleunigung der Entwicklung neuer Behandlungen.

Eine Regressionslinie für die Kosten einer klinischen Studie

Laden Sie das Pitch Deck für das Clinical Trial Risk Tool herunter

Was ist mit generativer KI und GPT?

Dokumente in der klinischen Forschung sind oft streng vertraulich. Wir haben in diesem Projekt keine generativen Modelle wie GPT-4 oder Google Gemini verwendet, da sie für unsere Anforderungen oft nicht schnell genug sind und bei einem so großen Dokument wie den in der Pharmazie verwendeten Dokumenten Probleme hätten. Außerdem sind sie bei den hochgradig domänenspezifischen Aufgaben nicht so gut .

Darüber hinaus sind wir uns bewusst, dass Forschungsorganisationen möglicherweise nicht damit einverstanden sind, dass wir ihre Daten an ein generatives Modell eines Drittanbieters senden. Aus diesem Grund läuft das CTRT vollständig auf unserer eigenen Cloud-Plattform (Server von Microsoft und Amazon) in einer sicheren Umgebung. Das Modell ist Open Source und die Kommunikation erfolgt über HTTPS. Sie können sicher sein, dass wir Ihre Daten nicht an ein generisches KI-Unternehmen eines Drittanbieters senden. Es besteht die Möglichkeit, ein generatives Modell selbst zu hosten, aber dies würde die anderen Einschränkungen der generativen KI für diesen Anwendungsfall nicht überwinden.

Informationen zu unserer Arbeit mit generativer KI finden Sie in unserem Insolvency Bot , einer interessanten Anwendung generativer KI im Rechtsbereich, die Retrieval Augmented Generation (RAG) nutzt, um Antworten in einem hochspezialisierten Bereich bereitzustellen, sowie in unseren Experimenten mit der Erkennung generativer KI .

Abdeckung des Clinical Trial Risk Tools auf anderen Websites

Diese Arbeit wurde ganz oder teilweise von der Bill & Melinda Gates Foundation [INV-050345] unterstützt und wir sind für diese Unterstützung sehr dankbar.

Ein Artikel, der das Tool beschreibt, wurde veröffentlicht unter: Wood TA und McNair D. Clinical Trial Risk Tool: Softwareanwendung mit natürlicher Sprachverarbeitung zur Ermittlung des Risikos mangelnder Aussagekraft von Studien. Gates Open Res 2023, 7:56 ( https://doi.org/10.12688/gatesopenres.14416.1 ).

Außerdem hat das Tool 🥇 den ersten Platz bei der Plotly Dash App Challenge 2023 gewonnen:

Thank you to all #PlotlyCommunity members who participated in the recent #Dash Example Apps Challenge, and congratulations to the winning submissions!

🥇 Clinical Trial Risk Dash App by Thomas Wood
🥈 SARIMA Tuner by Gabriele Albini
🥉 Product Environmental Report Dash App by…
— Plotly (@plotlygraphs) May 22, 2023

Wie zitiere ich das Clinical Trial Risk Tool?

Wenn Sie nur das Tool zitieren möchten, können Sie Folgendes zitieren:

Wood TA und McNair D. Clinical Trial Risk Tool: Softwareanwendung mit natürlicher Sprachverarbeitung zur Ermittlung des Risikos mangelnder Aussagekraft von Studien . Gates Open Res 2023, 7:56 doi: 10.12688/gatesopenres.14416.1 .

Ein BibTeX-Eintrag für LaTeX-Benutzer ist

@article{Wood_2023,
	doi = {10.12688/gatesopenres.14416.1},
	url = {https://doi.org/10.12688%2Fgatesopenres.14416.1},
	year = 2023,
	month = {apr},
	publisher = {F1000 Research Ltd},
	volume = {7},
	pages = {56},
	author = {Thomas A Wood and Douglas McNair},
	title = {Clinical Trial Risk Tool: software application using natural language processing to identify the risk of trial uninformativeness},
	journal = {Gates Open Research}
}