Harmonisierung unstrukturierter Textdaten mit NLP in der Psychologie (Harmony-Projekt)

· Thomas Wood
Harmonisierung unstrukturierter Textdaten mit NLP in der Psychologie (Harmony-Projekt)

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Wir haben ein Tool entwickelt, das die Verarbeitung natürlicher Sprache nutzt und Forschern in den Sozialwissenschaften dabei helfen soll, Datensätze aus verschiedenen Kontexten zu harmonisieren . Dies ist Teil eines umfassenderen Projekts namens Harmony , das Teil eines Beitrags ist, den wir gemeinsam mit dem Center for Longitudinal Studies an der UCL , der Universität Ulster und der Universidade Federal de Santa Maria in Brasilien für den Wellcome Mental Health Data Prize einreichen.

Die Forschungsfrage

Das Harmony-Projekt konzentriert sich auf eine Forschungsfrage:

Wie wirken sich soziale Kontakte auf Angstzustände und Depressionen bei jungen Menschen in verschiedenen Ländern aus?

Wir haben uns auf zwei sehr unterschiedliche Kontexte konzentriert: Großbritannien und Brasilien. Wir haben numerische Maße der sozialen Verbundenheit untersucht, die in Umfragen und Fragebögen gemessen werden können.

Einbindung junger Experten

Die Harmony-Forscher führten eine Reihe von Sitzungen mit jungen Menschen in beiden Ländern durch, um qualitative Daten zu individuellen Erfahrungen zu sammeln.

In Brasilien befragte unser Psychologe sechs Menschen im Alter zwischen 13 und 18 Jahren, die wegen Angstzuständen und Depressionen in Behandlung waren, und befragte sie zu ihrem Konzept von sozialer Bindung und deren Zusammenhang mit Angstzuständen und Depressionen.

Fast Data Science - London

Need a business solution?

NLP , ML und Data Science Leader seit 2016 – kontaktieren Sie uns für eine NLP- Beratungssitzung.

Aus diesen Initiativen gingen einige Unterschiede hervor. Britische Jugendliche nannten beispielsweise Mobbing als Hauptfaktor, während brasilianische Teilnehmer angaben, sich nicht beurteilt zu fühlen.

Vergleich der Daten aus Großbritannien und Brasilien

Für Großbritannien und Brasilien stehen Datensätze zur Verfügung, mit denen wir arbeiten konnten:

Diese Datensätze enthalten Variablen und Datenpunkte, die auf unterschiedliche Weise dargestellt werden können. Wenn wir eine Metaanalyse durchführen möchten (den Zusammenhang zwischen sozialer Verbindung, Angstzuständen und Depression in beiden Ländern vergleichen), müssen wir zunächst ermitteln, welche Variablen in beiden Datensätzen verfügbar sind, welche Variablen sie gemeinsam haben und wie wir dies tun können Vergleichen Sie die Informationen in diesen Variablen.

Wenn beispielsweise in einer Studie die Angst mithilfe des GAD-7 gemessen wurde und in einer anderen Studie Becks Anxiety Inventory verwendet wurde, würde in der Regel ein manueller Harmonisierungsprozess zur Identifizierung äquivalenter Fragebogenelemente stattfinden.

Die Lösung

Wir hatten die Idee, jedes Fragebogenelement als Vektor auf der Oberfläche einer mehrdimensionalen Kugel darzustellen. Elemente, die semantisch ähnlich sind, liegen nahe beieinander und haben eine Kosinusähnlichkeit nahe 1, während Elemente, die völlig unterschiedlich sind, tendenziell eine Ähnlichkeit nahe 0 haben.

Wir haben das Deep-Learning -Modell GPT-2 verwendet, um Texte in verschiedenen Sprachen in ihre Vektordarstellungen umzuwandeln. Wir haben dies in ein Web-Frontend verpackt, um ein webbasiertes Tool namens Harmony zu erstellen. Sie können es online unter https://harmonydata.ac.uk/app ausprobieren.

Partnerschaften

Wir haben Harmony auch in Zusammenarbeit mit DATAMIND und dem Catalogue of Mental Health Measures entwickelt, bei denen es sich um weit verbreitete Ressourcen in der Psychologieforschung handelt, und haben deren Feedback zur Verbesserung des Tools berücksichtigt.

Mehr über Harmony und seine Funktionsweise können Sie im Harmony-Blog lesen.

Verweise

  1. Radford, Alec, et al. “Language models are unsupervised multitask learners.” OpenAI blog 1.8 (2019): 9.

  2. Salum, Giovanni Abrahão. “High Risk Cohort Study for Psychiatric Disorders in Childhood.”

  3. Smith, Kate, and Heather Joshi. “The millennium cohort study.” POPULATION TRENDS-LONDON- (2002): 30-34.

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Big-Data-Beratung – 4 häufigste Probleme gelöst
Data scienceBig data

Big-Data-Beratung – 4 häufigste Probleme gelöst

Mittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution
Ai and societyData science

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution

Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.

KI im Personalwesen: Die Zukunft der Arbeit verändern
Ai and societyData science

KI im Personalwesen: Die Zukunft der Arbeit verändern

Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us