Harmonisierung unstrukturierter Textdaten mit NLP in der Psychologie (Harmony-Projekt)

· Thomas Wood
Harmonisierung unstrukturierter Textdaten mit NLP in der Psychologie (Harmony-Projekt)

Finden Sie Top-NLP-Talente!

Suchen Sie Experten in Natürlicher Sprachverarbeitung? Veröffentlichen Sie Ihre Stellenangebote bei uns und finden Sie heute Ihren idealen Kandidaten!

Veröffentlichen Sie einen Job

Wir haben ein Tool entwickelt, das auf der Verarbeitung natürlicher Sprache basiert und Forschern in den Sozialwissenschaften dabei helfen soll, Datensätze aus unterschiedlichen Kontexten zu harmonisieren . Dies ist Teil eines umfassenderen Projekts namens Harmony , das Teil eines Beitrags ist, den wir gemeinsam mit dem Centre for Longitudinal Studies am UCL , der Ulster University und der Universidade Federal de Santa Maria in Brasilien für den Wellcome Mental Health Data Prize einreichen.

Die Forschungsfrage

Im Mittelpunkt des Harmony-Projekts steht eine Forschungsfrage:

Welchen Einfluss haben soziale Kontakte auf Ängste und Depressionen bei jungen Menschen in verschiedenen Ländern?

Wir haben uns auf zwei sehr unterschiedliche Kontexte konzentriert: Großbritannien und Brasilien. Wir haben numerische Messungen der sozialen Verbundenheit untersucht, die in Umfragen und Fragebögen gemessen werden können.

Engagement junger Experten

Die Harmony-Forscher führten eine Reihe von Sitzungen mit jungen Menschen in beiden Ländern durch, um qualitative Daten zu individuellen Erfahrungen zu sammeln.

In Brasilien interviewte unser Psychologe sechs Personen zwischen 13 und 18 Jahren, die wegen Angstzuständen und Depressionen in Behandlung waren, und befragte sie zu ihrem Konzept sozialer Kontakte und deren Zusammenhang mit Angstzuständen und Depressionen.

Fast Data Science - London

Need a business solution?

Führend in den Bereichen NLP , ML und Data Science seit 2016 – kontaktieren Sie uns für eine NLP- Beratungssitzung.

Bei diesen Initiativen zeigten sich einige Unterschiede. So nannten britische Jugendliche beispielsweise Mobbing als einen der Hauptfaktoren, während brasilianische Teilnehmer angaben, sich nicht verurteilt zu fühlen.

Vergleich der Daten aus Großbritannien und Brasilien

Für Großbritannien und Brasilien stehen Datensätze zur Verfügung, mit denen wir arbeiten konnten:

Diese Datensätze enthalten Variablen und Datenpunkte, die auf unterschiedliche Weise dargestellt werden können. Wenn wir eine Metaanalyse durchführen möchten (den Zusammenhang zwischen sozialer Bindung, Angst und Depression in beiden Ländern vergleichen), müssen wir zunächst feststellen, welche Variablen in beiden Datensätzen verfügbar sind, welche Variablen sie gemeinsam haben und wie wir die Informationen in diesen Variablen vergleichen können.

Wenn beispielsweise in einer Studie Ängste mithilfe des GAD-7 gemessen wurden und in einer anderen Studie Becks Angstinventar , erfolgte typischerweise ein manueller Harmonisierungsprozess zur Ermittlung gleichwertiger Fragebogenelemente.

Die Lösung

Wir hatten die Idee, jedes Fragebogenelement als Vektor auf der Oberfläche einer mehrdimensionalen Kugel darzustellen. Elemente, die semantisch ähnlich sind, würden nah beieinander liegen und eine Kosinusähnlichkeit nahe 1 aufweisen, während Elemente, die völlig unterschiedlich sind, eher eine Ähnlichkeit nahe 0 aufweisen.

Wir haben das Deep-Learning -Modell GPT-2 verwendet, um Texte in verschiedenen Sprachen in ihre Vektordarstellungen umzuwandeln. Wir haben dies in ein Web-Frontend verpackt, um ein webbasiertes Tool namens Harmony zu erstellen. Sie können es online unter https://harmonydata.ac.uk/app ausprobieren.

Partnerschaften

Wir haben Harmony außerdem in Zusammenarbeit mit DATAMIND und dem Catalogue of Mental Health Measures entwickelt, die in der psychologischen Forschung weit verbreitete Ressourcen sind, und ihr Feedback zur Verbesserung des Tools berücksichtigt.

Im Harmony-Blog können Sie mehr über Harmony und seine Funktionsweise erfahren.

Verweise

  1. Radford, Alec, et al. „Sprachmodelle sind unüberwachte Multitask-Lerner.“ OpenAI Blog 1.8 (2019): 9.

  2. Salum, Giovanni Abrahão. „Hochrisiko-Kohortenstudie für psychiatrische Störungen im Kindesalter.“

  3. Smith, Kate und Heather Joshi. „Die Millennium-Kohortenstudie.“ POPULATION TRENDS-LONDON- (2002): 30-34.

Finden Sie Top-NLP-Talente!

Suchen Sie Experten in Natürlicher Sprachverarbeitung? Veröffentlichen Sie Ihre Stellenangebote bei uns und finden Sie heute Ihren idealen Kandidaten!

Veröffentlichen Sie einen Job

Generative KI
Generative ki

Generative KI

Generative KI Einführung Generative KI , ein Teilbereich der KI, verändert Branchen grundlegend und gestaltet die Zukunft. Durch die Nutzung fortschrittlicher Algorithmen kann generative KI Inhalte, Designs und Lösungen erstellen, die zuvor undenkbar waren.

Große Daten
Große daten

Große Daten

Große Daten Das Aufkommen von Big Data hat ganze Branchen revolutioniert und traditionelle Geschäftsmodelle und Entscheidungsprozesse verändert. In dieser umfassenden Untersuchung gehen wir der Frage nach, was Big Data ist, welche erheblichen Auswirkungen es auf die Geschäftsstrategie hat und wie Unternehmen riesige Datenmengen nutzen können, um Innovationen voranzutreiben und sich einen Wettbewerbsvorteil zu verschaffen.

KI im Finanzwesen
Ki im finanzwesen

KI im Finanzwesen

KI im Finanzwesen Die Integration künstlicher Intelligenz (KI) in den Finanzsektor hat die Arbeitsweise von Institutionen revolutioniert, von der Automatisierung von Abläufen bis hin zur Verbesserung der Kundenbindung und des Risikomanagements.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us