Revolutionierung der Datenwissenschaft bei gemeinnützigen Organisationen

· Thomas Wood
Revolutionierung der Datenwissenschaft bei gemeinnützigen Organisationen

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Wie können die Verarbeitung natürlicher Sprache und die Datenwissenschaft gemeinnützigen Organisationen wie der White Ribbon Alliance dabei helfen, Umfragedaten zu analysieren und sie mit der Welt zu teilen? Wir haben ein interaktives Dashboard entwickelt, das es der Öffentlichkeit ermöglicht, die Gesundheitsbedürfnisse von Frauen auf der ganzen Welt zu erkunden. Wir glauben, dass dies eine Premiere für Transparenz im dritten Sektor ist. Klicken Sie hier , um das Dashboard anzuzeigen, das Fast Data Science für die White Ribbon Alliance entwickelt hat.

Screenshot of What Women Want NLP Dashboard

Screenshot des NLP-Dashboards „Was Frauen wollen“.

Hunderttausende Unternehmen und Organisationen führen jedes Jahr Umfragen zu unterschiedlichen Zwecken durch. Einige davon werden von Marketingexperten durchgeführt, die in die Köpfe ihrer Zielgruppe eindringen und deren Kaufverhalten besser verstehen möchten. Gleichzeitig entwickeln gemeinnützige Organisationen und Wohltätigkeitsorganisationen Umfragen, die sich auf Themen wie psychische Gesundheit, Gesundheitsbedürfnisse von Frauen oder Hygiene konzentrieren. Welche Art von Befragung Sie durchführen sollten, hängt ganz von Ihrem Geschäftsmodell und Ihren Anforderungen ab.

Der Vorteil von Umfragen besteht darin, dass sie Unternehmen und gemeinnützigen Organisationen Daten liefern, die sie nutzen können, um ihre Bedürfnisse zu erfüllen und Mehrwert zu schaffen. Aber die Durchführung einer Umfrage ist nicht immer mit Sonnenschein und Regenbogen verbunden.

Unternehmen müssen nicht nur sicherstellen, dass die von ihnen durchgeführten Umfragen von Anfang an perfekt gestaltet sind und alle Informationen erfassen, die sie in die Hände bekommen möchten, sondern sie müssen auch unzählige Stunden damit verbringen, die Daten zu analysieren.

Im Großen und Ganzen können Umfragedaten entweder im numerischen oder im Textformat vorliegen. Die Analyse numerischer Daten ist keine so große Sache. Das Problem liegt in der Analyse von Textdaten.

Video über die Umfrage „What Women Want“ der in den USA ansässigen gemeinnützigen White Ribbon Alliance. Wir haben Datenwissenschaft und Verarbeitung natürlicher Sprache genutzt, um die Umfrageantworten zu analysieren.

Datenwissenschaftler können Textdaten in zwei Arten unterteilen:

  • Geschlossene Fragen: Multiple-Choice-Fragen (auch kategoriale Daten genannt)
  • Offene Fragen: Auf diese Fragen gibt es keine festen Antworten
Data science example of a closed-ended multiple-choice question in a survey. The user must choose one of the options.

Beispiel einer geschlossenen Multiple-Choice-Frage in einer Umfrage. Der Benutzer muss eine der Optionen auswählen.

Data science example of an open-ended question in a survey, where the respondent can reply in free text.

Beispiel einer offenen Frage in einer Umfrage, bei der der Befragte im Freitext antworten kann.

Die Antworten auf geschlossene Fragen sind einfach zu kodieren und quantifizierbar. Bei den offenen Fragen ist das jedoch nicht der Fall.

Offene Fragen dienen dazu, aussagekräftige Antworten zu sammeln und Unternehmen dabei zu helfen, umfangreiche und qualitative Daten zu erstellen, insbesondere wenn es nicht möglich ist, im Voraus über alle möglichen Antworten nachzudenken. Ein Befragter kann eine offene Frage vollständig mit eigenen Worten beantworten.

Antworten auf offene Fragen sind äußerst schwer zu programmieren und zu analysieren und können auf die folgenden drei Arten erfolgen:

  • Manuelle Codierung
  • Auslagerung
  • Automatisierung der Codierung

Die Nachteile herkömmlicher Umfrageanalysetechniken bestehen nicht nur darin, dass sie zeitaufwändig sind und von den Unternehmen einen enormen Arbeitsaufwand erfordern, sondern auch anfällig für ungenaue Datenanalysen sind.

Fast Data Science - London

Non-profit data science?

Seit 2020 im Non-Profit-Bereich im Bereich NLP und Datenwissenschaft tätig. Zu unseren Kunden zählen die White Ribbon Alliance, die Gates Foundation und die Weltgesundheitsorganisation.

Lassen Sie uns über die Umfrage „What Women Want“ sprechen, die von der amerikanischen Non-Profit-Organisation White Ribbon Alliance (WRA) durchgeführt wurde und Antworten von Millionen von Frauen auf der ganzen Welt gesammelt hat. Darüber hinaus sprechen wir über die Herausforderungen bei der Analyse dieser Textdatenmenge.

Bevor wir beginnen, lassen Sie uns etwas mehr über die Organisation und ihre Arbeit erfahren.

Über die White Ribbon Alliance

Die Frauen der Kampagne „Was Frauen wollen“ antworteten, indem sie ihre Gesundheitsanfragen in ihrer eigenen Sprache und mit ihren eigenen Worten verfassten. Die ultimative offene Umfragefrage!

Die White Ribbon Alliance ist eine der bekanntesten amerikanischen Non-Profit-Organisationen, die sich für die Förderung der reproduktiven und allgemeinen Gesundheit und Rechte von Frauen und Mädchen einsetzt. Die Organisation konzentriert sich stark auf die Lösung des Problems des Todes von Frauen während der Geburt und Schwangerschaft.

Kürzlich führten sie ihre Umfrage „What Women Want“ durch, bei der Antworten von über einer Million Frauen weltweit erfasst wurden und die sich stark darauf konzentrierte, herauszufinden, welche Art von Gesundheitsdiensten Frauen tatsächlich am meisten benötigen

Die WRA und ihre Partnerorganisationen haben über eine Million Frauen und heranwachsende Mädchen auf der ganzen Welt gefragt:

Was ist Ihr größter Wunsch für Ihre mütterliche und reproduktive Gesundheitsversorgung?

Frauen aus Ländern wie Mexiko, Indien, Malawi, Kenia, Pakistan, Uganda, Nigeria und Tansania haben ihre Antworten aufgezeichnet, und Sie können sich die Ergebnisse gleich hier ansehen.

Während die Durchführung einer so groß angelegten Umfrage an sich schon ein riesiges Unterfangen war, war es auch äußerst schwierig, die gesammelten Daten zu analysieren.

Da es sich um eine offene Frage handelte, erfolgten die Antworten in Textform. Daher war es für WRA schwierig, alles mithilfe herkömmlicher Techniken zur Analyse von Umfragedaten zu analysieren. Darüber hinaus zeichneten einige Befragte ihre Antworten in ihrer Muttersprache auf, die ins Englische übersetzt werden musste. Etwa 70 % der Gesamtantworten wurden von einem speziell geschulten Team sorgfältig von Hand codiert.

Die Umfrageantworten, die nicht manuell codiert werden konnten, wurden mithilfe verschiedener maschineller Lern- und NLP-Modelle, beispielsweise des BERT-Modells ( Bidirektionale Encoder-Repräsentationen von Transformern ), automatisch getaggt.

Mithilfe modernster Techniken des maschinellen Lernens konnten unsere Experten von Fast Data Science die Daten bereinigen und die verbleibenden uncodierten Umfrageantworten automatisch in verschiedene Themenbereiche wie Wasser, Hygiene und Sanitärversorgung kategorisieren. Klicken Sie hier , um zu unserem Dashboard zu gelangen, das die Verarbeitung natürlicher Sprache und maschinelles Lernen nutzt und es den WRA-Mitarbeitern, politischen Entscheidungsträgern und der Öffentlichkeit ermöglicht, die Daten der Kampagne aus aller Welt schnell und einfach zu analysieren.

Im wahrsten Sinne des Wortes kann jeder überall auf diese riesige Datenmenge zugreifen und sie einfach analysieren, ohne dass er ein erfahrener Statistiker sein muss.

Lassen Sie uns tief in die praktischen Aspekte unseres Dashboards eintauchen.

Sobald Sie das Dashboard besuchen, werden Sie mit einem kurzen Tutorial begrüßt, das Sie herumführt und Sie mit seinen Funktionen vertraut macht.

Mit den Optionen „Drill Down“ vs. „Vergleichen mit “ können Sie ganz einfach zwei Gruppen oder Segmente von Befragten vergleichen, in unserem Fall die Mädchen und Frauen, die an der Umfrage geantwortet haben.

Sie können beispielsweise herausfinden, wie sich die Reaktionen kamerunischer Frauen von denen indischer unterschieden.

Hier ist unser Drill-Down-Bereich:

The filters control view of the non-profit What Women Want's data science dashboard.

Die Filter steuern die Ansicht des Dashboards „Was Frauen wollen“.

Und hier ist unser Abschnitt „Vergleichen mit“:

The Compare to view of the non-profit What Women Want's data science dashboard.

Die Filter „Vergleichen mit“ steuern die Ansicht des Dashboards „Was Frauen wollen“.

Wir haben verglichen, wie sich die Antworten kamerunischer Frauen von denen indischer Frauen zum Thema „Umweltgesundheit und landwirtschaftliche Unterstützung“ unterschieden, und hier sind die Ergebnisse:

Non-profit data science dashboard age histogram

Das Datenwissenschafts-Dashboard „Was Frauen wollen“ kann so eingestellt werden, dass kamerunische und indische Frauen verglichen werden, die ein bestimmtes Thema erwähnt haben, sodass der Benutzer einen Drilldown auf ein hohes Maß an Granularität durchführen kann.

Non-profit data science dashboard survey

Mit dem NLP-Dashboard können Sie Teilmengen der Rohumfrageantworten sowie das Alter und den Standort dieser Frauen anzeigen.

Das Dashboard ermöglicht außerdem einen Drilldown in Ein-, Zwei- und Drei-Wort-Phrasen (Trigramme) sowie eine Kartenansicht der Standorte der Befragten.

Lassen Sie uns den Drilldown und den Vergleich mit den Abschnitten noch weiter aufschlüsseln:

  • Länder auswählen: Dies hilft Ihnen, sich je nach Ihren Anforderungen auf Antworten aus einem bestimmten Land oder einer bestimmten Tätigkeitsregion der gemeinnützigen Organisation zu konzentrieren.
  • Antwortthemen auswählen: Hier können Sie ganz einfach ein Thema auswählen.
  • Nach Alter filtern: Das Alter der befragten Frauen lag zwischen 14 und 60+. Sie können Daten nach Alter filtern.
  • Nach Schlüsselwort filtern: Die Daten können nach bestimmten Schlüsselwörtern wie Blut gefiltert werden.
  • Schlüsselwort ausschließen: Sie können beliebige Schlüsselwörter ausschließen.

Stellen wir unsere Drilldown-Optionen wie folgt ein:

  • Länder: Indien, Malawi, Kenia, Pakistan
  • Themen: „Umweltgesundheit und landwirtschaftliche Unterstützung“, „Evidenz, Forschung, Innovation und Technologie“, „Politik und politischer Wandel“, „Rechtzeitige und aufmerksame Pflege“.
  • Filtern nach Alter: 30-50

So sehen die Ergebnisse aus:

Sie können sich einen kurzen Vergleich zwischen den von der gemeinnützigen Organisation in Indien, Malawi, Nigeria und Indien befragten Frauen im Alter zwischen 30 und 50 Jahren zu den von Ihnen ausgewählten Themen und allen befragten Frauen ansehen. Darüber hinaus ist die Grafik sehr detailliert und hilft Ihnen dabei, genau zu bestimmen, was Sie wollen.

Es wird Sie fassungslos machen.

Darüber hinaus können Sie auf der linken Seite einen Blick auf die Umfrageantworten werfen, indem Sie auf das Thema klicken. Auf der rechten Seite können Sie die tatsächlichen Antworten einsehen.

Auf der linken Seite können Sie die Umfrageantworten anzeigen, die ein Wort oder eine Phrase enthalten, und diese je nach Ihren Anforderungen auf „Ein-Wort-Phrasen“, „Zwei-Wort-Phrasen“ und „Drei-Wort-Phrasen“ einstellen.

Auf der rechten Seite kann man die Weltkarte anzeigen, die Blasen umschalten, hineinzoomen und Daten für das jeweilige Land anzeigen.

Klingt beeindruckend, nicht wahr?

In diesem Fall möchte ich Sie in die Welt der Datenwissenschaft einführen und zeigen, wie Datenwissenschaft und Verarbeitung natürlicher Sprache die Arbeit gemeinnütziger Organisationen revolutionieren können.

Das Problem besteht nicht darin, Daten zu finden. Es geht darum, herauszufinden, was genau man damit machen soll.“

Mike Loukides, O’Reilly Media

Möchten Sie Ihr eigenes Dashboard? Ob gemeinnützige Organisationen oder Unternehmen, Fast Data Science erfüllt Ihre Anforderungen

Unternehmen verfügen möglicherweise über eine Welt voller unstrukturierter Daten und wissen nicht, was sie damit anfangen sollen. Und genau da kommen wir ins Spiel.

Wer ist Fast Data Science?

Bei Fast Data Science nutzen wir die Leistungsfähigkeit der KI, um Sie bei Ihren Unternehmungen zu unterstützen. Unsere Experten bieten Ihnen von Beginn an hochprofessionelle Data-Science-Beratung für Ihr Unternehmen. Unsere größte Stärke ist, dass wir mit den neuesten Trends Schritt halten und in der Lage sind, mit erhobenem Kopf auf verschiedene Herausforderungen zu reagieren. Bei uns werden Sie nicht das Gefühl haben, mit einem anderen dieser technisch nicht versierten Vertriebsmitarbeiter zu sprechen. Jeder von uns ist ein professioneller Datenwissenschaftler, der KI zum Wohle der Allgemeinheit einsetzt.

Benötigen Sie Hilfe bei der Analyse dieser riesigen Umfrage? Möchten Sie ein technisch fortschrittliches Dashboard wie das, das wir für WRA erstellt haben? Es ist an der Zeit, dass Sie sich umgehend bei uns melden. Unsere Experten vereinbaren einen Termin mit Ihnen und würden gerne mehr über Ihre Umfrage erfahren und sich eingehend mit ihr befassen. Darüber hinaus stellen wir Ihnen unsere erstklassigen datenwissenschaftlichen Beratungsdienste zur Verfügung, um den Prozess hocheffizient zu gestalten. Und sobald wir alles auf dem Tisch haben, werden wir unser Bestes geben und ein äußerst reaktionsfähiges Dashboard für Ihre Kampagnen erstellen.

Es ist also an der Zeit, sich zurückzulehnen und sich sofort von Ihren Datenanalyseproblemen zu verabschieden.

Sie brauchen sich nur mit uns in Verbindung zu setzen, wir helfen Ihnen gerne weiter.

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Big-Data-Beratung – 4 häufigste Probleme gelöst
Data scienceBig data

Big-Data-Beratung – 4 häufigste Probleme gelöst

Mittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution
Ai and societyData science

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution

Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.

KI im Personalwesen: Die Zukunft der Arbeit verändern
Ai and societyData science

KI im Personalwesen: Die Zukunft der Arbeit verändern

Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us