Harmony (Beitrag zum Wellcome Data Prize im Bereich psychische Gesundheit)

Harmony (Beitrag zum Wellcome Data Prize im Bereich psychische Gesundheit)

Wellcome Data-Preise

Vier gesundheitliche Herausforderungen

500.000 £ werden zwischen drei Teams aufgeteilt

Harmony ist ein Open-Source-NLP-basiertes Datenharmonisierungstool, das für den Wellcome Data Prize entwickelt wurde.

Was macht Harmony?

  • Psychologen und Sozialwissenschaftler müssen häufig Fragen in verschiedenen Fragebögen zuordnen, wie etwa „Ich fühle mich oft ängstlich“ und „Ich fühle mich nervös, ängstlich oder beunruhigt“.
  • Dies nennt man Harmonisierung .
  • Die Harmonisierung ist ein zeitaufwändiger und subjektiver Prozess.
  • Es macht keinen Spaß, lange Fragebögen im PDF-Format durchzugehen und die Fragen in Excel einzugeben.
  • Hier kommt Harmony ins Spiel, ein Tool, das natürliche Sprachverarbeitung und generative KI-Modelle nutzt, um Forschern dabei zu helfen, Fragebogenelemente auch in verschiedenen Sprachen zu harmonisieren.

Wir haben Harmony unter Verwendung der Verarbeitung natürlicher Sprache entwickelt, um es Forschern zu ermöglichen, in Zusammenarbeit mit der University of Ulster , dem University College London und der Universidade Federal de Santa Maria in Brasilien Metaanalysen von Studien zur psychischen Gesundheit für den Data Prize in Mental Health des Wellcome Trust durchzuführen . Weitere Informationen finden Sie auf der Projektwebsite .

Der Wellcome Trust hat die Wellcome Data Prizes ins Leben gerufen, die sich an multidisziplinäre Teams richten, die vorhandene Daten verwenden, um wichtige Forschungsfragen zu beantworten. Die Preise konzentrieren sich auf gesundheitliche Herausforderungen in vier Bereichen: Klima und Gesundheit, Infektionskrankheiten, psychische Gesundheit und Entdeckungsforschung. In unserem Fall haben wir uns auf das Problem der Datenharmonisierung mithilfe von NLP konzentriert.

Fast Data Science nahm in einem von Dr. Eoin McElroy an der University of Ulster geleiteten Team am Wellcome Trust Data Prize in Mental Health teil, um ein Datenharmonisierungstool für die Verarbeitung natürlicher Sprache namens Harmony zu entwickeln. Weitere Informationen zu Harmony finden Sie auf der Website von Ulster .

Forscher in der Psychologie und den Sozialwissenschaften müssen häufig Metaanalysen von Forschungsergebnissen über lange Zeiträume und Kulturen hinweg durchführen, um Trends zu erkennen. Unser Team untersuchte beispielsweise die Auswirkungen sozialer Isolation und Einsamkeit auf das psychische Wohlbefinden im Laufe der Zeit und konzentrierte sich dabei auf zwei Gesellschaften (Großbritannien und Brasilien).

Psychologen in der Primärversorgung verwenden häufig den Fragebogen zur generalisierten Angststörung 7 (GAD-7) als Instrument zur Quantifizierung von Angstzuständen, aber in der Vergangenheit wurden auch andere Fragebögen verwendet, wie beispielsweise das Beck-Angst-Inventar . Der Beck-Fragebogen konzentriert sich mehr auf körperliche Symptome, während der GAD-7 mehr Fragen zum psychischen Zustand enthält. Es kann schwierig sein, Datensätze mit verschiedenen Fragebögen zu vergleichen.

Mit unserem Tool Harmony können Forscher eine Reihe von Fragebögen zur psychischen Gesundheit im PDF- oder Excel-Format hochladen, beispielsweise den Angstfragebogen GAD-7. Es identifiziert, welche Fragen in den Fragebögen identisch, in der Bedeutung ähnlich oder Antonyme zueinander sind, und generiert ein Netzwerkdiagramm. Auf diese Weise können Forscher Datensätze harmonisieren.

Interested in open source?

Join open source project

Interessiert an FOSS? Das Harmony-Projekt ist ein Open-Source-Projekt auf der Suche nach Mitwirkenden. Sie können dem Discord-Server von Harmony beitreten oder für weitere Informationen harmonydata.ac.uk/community/ besuchen.

Einzigartig ist, dass Harmony auf einer Transformer-Neuralnetz- Architektur (Large Language Model/LLM) basiert und nicht von einem Wörterbuchansatz oder einer Wortliste abhängig ist. Dies ist eine Abkehr von früheren Ansätzen in den Sozialwissenschaften. Unser Ansatz ermöglicht mehrsprachige Unterstützung (Englisch und Portugiesisch sind unsere Schwerpunktsprachen, aber wir haben die Unterstützung kürzlich auf über acht Sprachen erweitert ), und Harmony ist in der Lage, den in Großbritannien verwendeten GAD-7 korrekt dem in Brasilien verwendeten GAD-7 zuzuordnen, obwohl der brasilianische Fragebogen in brasilianischem Portugiesisch verfasst ist.

Mithilfe von Harmony konnte unser Team bahnbrechende Untersuchungen zu sozialer Isolation und Angst durchführen, wobei NLP eine quantitative Messung der Gleichwertigkeit der verschiedenen Datensätze zur psychischen Gesundheit lieferte.

GAD-7 anxiety questionnaire

Wir haben unser Tool auch auf Github als Python-Bibliothek und R-Bibliothek sowie als REST-API und Docker-Container veröffentlicht.

Making sustainable software

Open source project

Lesen Sie über unsere Beratung mit dem Software Sustainability Institute, um das Harmony-Projekt nach dem Ende der Wellcome-Finanzierung nachhaltiger zu gestalten.

In diesem Vorabdruck, der auf die Veröffentlichung wartet, können Sie lesen, wie wir Harmonys Leistung bei der Vorhersage realer Daten validiert haben:

Das Harmony-Team

Harmony team

Das an Harmony arbeitende Team bestand aus:

Dr. Eoin McElroy , Dozent an der Fakultät für Psychologie der Universität Ulster , Nordirland

Dr. Bettina Moltrecht , wissenschaftliche Mitarbeiterin für Bevölkerungsgesundheit und quantitative Sozialwissenschaften am University College London

Prof. George Ploubidis , Professor für Bevölkerungsgesundheit und Statistik am Social Research Institute des University College London

Dr. Mauricio Scopel Hoffmann , Außerordentlicher Professor in der Abteilung für Neuropsychiatrie an der Universidade Federal de Santa Maria , Brasilien

Thomas Wood – Datenwissenschaftler und Experte für natürliche Sprachverarbeitung bei Fast Data Science Ltd

Wie zitiere ich Harmony?

Wenn Sie nur das Tool zitieren möchten, können Sie Folgendes zitieren:

Wood, TA, McElroy, E., Moltrecht, B., Ploubidis, GB, Scopel Hoffmann, M., Harmony [Computersoftware], Version 1.0, abgerufen unter https://harmonydata.ac.uk/app. Ulster University (2022)

oder

McElroy, E., Wood, TA, Bond, R., Mulvenna, MD, Shevlin, M., Ploubidis, G., … Moltrecht, B. (1. September 2023). Verwendung natürlicher Sprachverarbeitung zur Erleichterung der Harmonisierung von Fragebögen zur psychischen Gesundheit: eine Validierungsstudie mit realen Daten. https://doi.org/10.31234/osf.io/rxpv9

Ein BibTeX-Eintrag für LaTeX-Benutzer ist

@unpublished{harmony,
    AUTHOR = {Wood, T.A., McElroy, E., Moltrecht, B., Ploubidis, G.B., Scopel Hoffman, M.},
    TITLE  = {Harmony (Computer software), Version 1.0},
    YEAR   = {2022},
    Note   = {To appear},
    url = {https://harmonydata.ac.uk/app}
}

Sie können auch das umfassendere Harmony-Projekt zitieren, das bei der Open Science Foundation registriert ist:

McElroy, E., Moltrecht, B., Scopel Hoffmann, M., Wood, TA, & Ploubidis, G. (6. Januar 2023). Harmony – Eine globale Plattform für kontextuelle Harmonisierung, Übersetzung und Zusammenarbeit in der Forschung zur psychischen Gesundheit. Abgerufen von osf.io/bct6k

@misc{McElroy_Moltrecht_Scopel Hoffmann_Wood_Ploubidis_2023,
  title={Harmony - A global platform for contextual harmonisation, translation and cooperation in mental health research},
  url={osf.io/bct6k},
  publisher={OSF},
  author={McElroy, Eoin and Moltrecht, Bettina and Scopel Hoffmann, Mauricio and Wood, Thomas A and Ploubidis, George},
  year={2023},
  month={Jan}
}

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us