Suchen Sie Experten in Natürlicher Sprachverarbeitung? Veröffentlichen Sie Ihre Stellenangebote bei uns und finden Sie heute Ihren idealen Kandidaten!
Veröffentlichen Sie einen JobKlinische Studien sind ein wesentlicher Bestandteil der Markteinführung neuer Medikamente, doch ihre Planung und Durchführung kann ein komplexer und kostspieliger Prozess sein. Ein wesentlicher Teil dieser Planung ist die genaue Einschätzung der Kosten und Risiken einer Studie. Traditionell war hierfür ein Expertenteam erforderlich, das lange, oft Hunderte von Seiten umfassende Protokolle klinischer Studien manuell durchging.
Fast Data Science entwickelt das Clinical Trial Risk Tool weiter, ein NLP-Modell, das die Verarbeitung natürlicher Sprache (NLP) nutzt, um Protokolle klinischer Studien zu analysieren und automatisch entscheidende Kosten- und Risikofaktoren zu extrahieren.
Ein klinisches Studienprotokoll ist ein wichtiger Bestandteil der Durchführung einer Studie und wird vor Beginn der klinischen Studie erstellt. Es handelt sich dabei um ein langes Dokument, das oft etwa 200 Seiten lang und im PDF-Format ist. Studienprotokolle beschreiben die Ziele und das Design einer Studie, liefern die Gründe und den Hintergrund für die Studie und müssen Standards erfüllen, die den Grundsätzen guter klinischer Praxis entsprechen.
Die Kosten oder das Risiko einer klinischen Studie abzuschätzen, ist ein schwieriges Problem, da es sich um eine Geschäftsbewertung handelt, die ein Expertenteam erfordert, das das Protokoll gründlich lesen muss. Dies geschieht in der Regel manuell in Pharmaunternehmen , Finanzierungsorganisationen oder Auftragsforschungsinstituten (CROs). Die Protokolle sind in der Regel in komplexer, hochspezialisierter Sprache verfasst, sind aber grundsätzlich in natürlicher Sprache und nicht in einem strukturierten oder tabellarischen Format. Dies macht das Problem zu einem idealen Feld für KI und NLP im Gesundheitswesen .
Die Verarbeitung natürlicher Sprache (NLP) ist das Teilgebiet der KI, das sich damit beschäftigt, Computern das Verstehen und Verarbeiten menschlicher Sprache zu ermöglichen. Das Clinical Trial Risk Tool verwendet NLP, um Protokolle klinischer Studien zu „lesen“ und wichtige Informationen wie die Art der Behandlung, den untersuchten Zustand (Pathologie) und die erforderliche Teilnehmerzahl zu extrahieren. Diese extrahierten Daten werden dann verwendet, um potenzielle Risiken und Kosten im Zusammenhang mit der Studie abzuschätzen.
Estimate the risk or cost of a clinical trial
Die erste Version des Clinical Trial Risk Tool, die sich auf HIV- und TB-Studien in Ländern mit niedrigem und mittlerem Einkommen konzentriert, ist vollständig Open Source. Dies ermöglicht die Zusammenarbeit und Weiterentwicklung durch die breitere wissenschaftliche Gemeinschaft.
Fast Data Science sucht aktiv nach Partnern in der Pharmaindustrie, wie etwa Geldgebern, Pharmaunternehmen, MedTech, Forschungsorganisationen und CROs, um die Fähigkeiten des Tools zu erweitern und ein breiteres Spektrum an Pathologien, Testphasen und Interventionsarten abzudecken. Eine große Herausforderung ist der Zugang zu vertraulichen Industriedaten zu den Kosten von Studien, da viele Protokolle nicht öffentlich auf Repositorien wie ClinicalTrials.gov oder EudraCT verfügbar sind und Kostendaten normalerweise nicht veröffentlicht werden.
Sie können den Quellcode unter https://github.com/fastdatascience/clinical_trial_risk herunterladen und ausführen.
Fast Data Science verbessert das Clinical Trial Risk Tool ständig, einschließlich der Entwicklung von Regressionsmodellen zur Vorhersage der Kosten einer Studie auf Basis historischer Daten. Diese Kombination aus NLP und maschinellem Lernen ist vielversprechend für die Optimierung der Planung klinischer Studien, die Kostensenkung und letztlich die Beschleunigung der Entwicklung neuer Behandlungen.
Eine Regressionslinie für die Kosten einer klinischen Studie
Laden Sie das Pitch Deck für das Clinical Trial Risk Tool herunter
Dokumente in der klinischen Forschung sind oft streng vertraulich. Wir haben in diesem Projekt keine generativen Modelle wie GPT-4 oder Google Gemini verwendet, da sie für unsere Anforderungen oft nicht schnell genug sind und bei einem so großen Dokument wie den in der Pharmazie verwendeten Dokumenten Probleme hätten. Außerdem sind sie bei den hochgradig domänenspezifischen Aufgaben nicht so gut .
Darüber hinaus sind wir uns bewusst, dass Forschungsorganisationen möglicherweise nicht damit einverstanden sind, dass wir ihre Daten an ein generatives Modell eines Drittanbieters senden. Aus diesem Grund läuft das CTRT vollständig auf unserer eigenen Cloud-Plattform (Server von Microsoft und Amazon) in einer sicheren Umgebung. Das Modell ist Open Source und die Kommunikation erfolgt über HTTPS. Sie können sicher sein, dass wir Ihre Daten nicht an ein generisches KI-Unternehmen eines Drittanbieters senden. Es besteht die Möglichkeit, ein generatives Modell selbst zu hosten, aber dies würde die anderen Einschränkungen der generativen KI für diesen Anwendungsfall nicht überwinden.
Informationen zu unserer Arbeit mit generativer KI finden Sie in unserem Insolvency Bot , einer interessanten Anwendung generativer KI im Rechtsbereich, die Retrieval Augmented Generation (RAG) nutzt, um Antworten in einem hochspezialisierten Bereich bereitzustellen, sowie in unseren Experimenten mit der Erkennung generativer KI .
Diese Arbeit wurde ganz oder teilweise von der Bill & Melinda Gates Foundation [INV-050345] unterstützt und wir sind für diese Unterstützung sehr dankbar.
Ein Artikel, der das Tool beschreibt, wurde veröffentlicht unter: Wood TA und McNair D. Clinical Trial Risk Tool: Softwareanwendung mit natürlicher Sprachverarbeitung zur Ermittlung des Risikos mangelnder Aussagekraft von Studien. Gates Open Res 2023, 7:56 ( https://doi.org/10.12688/gatesopenres.14416.1 ).
Außerdem hat das Tool 🥇 den ersten Platz bei der Plotly Dash App Challenge 2023 gewonnen:
Thank you to all #PlotlyCommunity members who participated in the recent #Dash Example Apps Challenge, and congratulations to the winning submissions!
— Plotly (@plotlygraphs) May 22, 2023
🥇 Clinical Trial Risk Dash App by Thomas Wood
🥈 SARIMA Tuner by Gabriele Albini
🥉 Product Environmental Report Dash App by…
Wenn Sie nur das Tool zitieren möchten, können Sie Folgendes zitieren:
Wood TA und McNair D. Clinical Trial Risk Tool: Softwareanwendung mit natürlicher Sprachverarbeitung zur Ermittlung des Risikos mangelnder Aussagekraft von Studien . Gates Open Res 2023, 7:56 doi: 10.12688/gatesopenres.14416.1 .
Ein BibTeX-Eintrag für LaTeX-Benutzer ist
@article{Wood_2023, doi = {10.12688/gatesopenres.14416.1}, url = {https://doi.org/10.12688%2Fgatesopenres.14416.1}, year = 2023, month = {apr}, publisher = {F1000 Research Ltd}, volume = {7}, pages = {56}, author = {Thomas A Wood and Douglas McNair}, title = {Clinical Trial Risk Tool: software application using natural language processing to identify the risk of trial uninformativeness}, journal = {Gates Open Research} }
Tauchen Sie ein in die Welt der Natürlichen Sprachverarbeitung! Entdecken Sie modernste NLP-Rollen, die zu Ihren Fähigkeiten und Leidenschaften passen.
NLP-Jobs entdeckenGenerative KI Einführung Generative KI , ein Teilbereich der KI, verändert Branchen grundlegend und gestaltet die Zukunft. Durch die Nutzung fortschrittlicher Algorithmen kann generative KI Inhalte, Designs und Lösungen erstellen, die zuvor undenkbar waren.
Große Daten Das Aufkommen von Big Data hat ganze Branchen revolutioniert und traditionelle Geschäftsmodelle und Entscheidungsprozesse verändert. In dieser umfassenden Untersuchung gehen wir der Frage nach, was Big Data ist, welche erheblichen Auswirkungen es auf die Geschäftsstrategie hat und wie Unternehmen riesige Datenmengen nutzen können, um Innovationen voranzutreiben und sich einen Wettbewerbsvorteil zu verschaffen.
What we can do for you