Case Studies

Datenwissenschaftliche Beratung
Case Studies
Interpretation von Grundbucheinträgen mithilfe natürlicher Sprachverarbeitung

Interpretation von Grundbucheinträgen mithilfe natürlicher Sprachverarbeitung

Wir wurden von einem nationalen Grundbuchamt beauftragt, mittels NLP Grundbucheinträge zu interpretieren, die in unstrukturierter Rechtssprache verfasst sind. Ein Problem, mit dem Grundbücher weltweit konfrontiert sind, ist sowohl die Digitalisierung älterer Grundbucheinträge als auch die Umwandlung des Freitextfelds, das einen Grundbucheintrag beschreibt, in strukturierte Daten.

Verwendung von NLP zur Vorhersage von Kundeneskalationen

Verwendung von NLP zur Vorhersage von Kundeneskalationen

Im Rahmen eines Engagements für eine KI-Strategie untersuchten wir das Potenzial von NLP und maschinellem Lernen für eine kanadische Wohnungsbaubehörde.

Open-Source-Tools für die Verarbeitung natürlicher Sprache

Open-Source-Tools für die Verarbeitung natürlicher Sprache

Open-Source-Projekte (MIT-Lizenz) Wir haben an zwei externen Projekten teilgenommen, bei denen Open-Source-Code und -Daten produziert wurden, die der Öffentlichkeit für den persönlichen und kommerziellen Gebrauch zur Verfügung stehen.

Python-Bibliothek zur Erkennung von Arzneimitteln mit benannter Entität

Python-Bibliothek zur Erkennung von Arzneimitteln mit benannter Entität

Erkennen von Medikamentennamen in unstrukturiertem englischen Text mit Python Wir haben eine Python-Bibliothek namens Drug Named Entity Recognition als Open Source freigegeben, um Medikamentennamen in einer Zeichenfolge zu finden.

Python-Bibliothek zur Erkennung länderspezifischer benannter Entitäten

Python-Bibliothek zur Erkennung länderspezifischer benannter Entitäten

Ländernamen in unstrukturiertem englischen Text mit Python erkennen Wir haben eine Python-Bibliothek namens Country Named Entity Recognition als Open Source freigegeben, um Ländernamen in einer Zeichenfolge zu finden.

Harmony (Beitrag zum Wellcome Data Prize im Bereich psychische Gesundheit)

Harmony (Beitrag zum Wellcome Data Prize im Bereich psychische Gesundheit)

Harmony ist ein Open-Source-NLP-basiertes Datenharmonisierungstool, das für den Wellcome Data Prize entwickelt wurde. Was macht Harmony? Psychologen und Sozialwissenschaftler müssen häufig Fragen in verschiedenen Fragebögen zuordnen, wie etwa „Ich fühle mich oft ängstlich“ und „Ich fühle mich nervös, ängstlich oder beunruhigt“.

Clinical Trial Risk Tool

Clinical Trial Risk Tool

Maschinelles Lernen in klinischen Studien: Wir haben für die Gates Foundation ein Tool zur Risikobewertung klinischer Studien unter Verwendung der Verarbeitung natürlicher Sprache entwickelt, um Experten dabei zu unterstützen, das Risiko eines nicht informativen Endes einer klinischen Studie abzuschätzen.

Drag-and-Drop-GUI-Dashboard für maschinelles Lernen – Office of Rail and Road

Drag-and-Drop-GUI-Dashboard für maschinelles Lernen – Office of Rail and Road

Erstellen einer GUI für maschinelles Lernen für das Office of Rail and Road Das Office of Rail and Road (ORR) ist die britische nationale Eisenbahnregulierungsbehörde, die für Gesundheit und Sicherheit auf den Hauptstrecken des Schienenverkehrs, der Londoner U-Bahn, der Stadtbahn und der Straßenbahnen verantwortlich ist.

Kausales maschinelles Lernen für die Kompetenzentwicklung in Schottland

Kausales maschinelles Lernen für die Kompetenzentwicklung in Schottland

Analyse von Beschäftigungs- und Bildungsergebnissen mithilfe von maschinellem Lernen und Kausalitätsmodellen Skills Development Scotland (SDS) ist die nationale Organisation in Schottland, die Menschen dabei unterstützt, ihre Fähigkeiten zu entwickeln und anzuwenden.

Boehringer Ingelheim – NLP-Clustering auf Fabrikfehlerberichten

Boehringer Ingelheim – NLP-Clustering auf Fabrikfehlerberichten

Wie wir mithilfe eines Clustering-Algorithmus für die Verarbeitung natürlicher Sprache dem Pharmaunternehmen Boehringer Ingelheim dabei geholfen haben, Einblicke in seine Herstellungsprozesse zu gewinnen und Probleme zu erkennen.

Büro des Informationskommissars – ML-E-Mail-Klassifizierungsmodell

Büro des Informationskommissars – ML-E-Mail-Klassifizierungsmodell

ICO: E-Mail-Klassifizierung Das Information Commissioner’s Office (ICO) ist die öffentliche Stelle, die für die Regulierung des Datenschutzes in Großbritannien verantwortlich ist.

CBT-Kliniken – Rekrutierung von Beratern, Psychiatern und Therapeuten

CBT-Kliniken – Rekrutierung von Beratern, Psychiatern und Therapeuten

CBT-Kliniken: Rekrutierung von Beratern, Psychiatern und Therapeuten CBT Clinics ist ein in Großbritannien ansässiges Unternehmen, das psychiatrische Fachkräfte vermittelt. Das Unternehmen verfügt über eine Liste von Beratern, Psychiatern und Therapeuten und wollte expandieren, um mehr Kliniker einzustellen und die Nuancen des Beratungs- und Therapiemarkts in Großbritannien zu verstehen.

Frühere Kunden von Fast Data Science

Wir arbeiten mit Kunden auf der ganzen Welt zusammen, die Mehrheit unserer Kunden befindet sich jedoch im Vereinigten Königreich, gefolgt von den USA und dem übrigen Europa.

Branchenkompetenz

Wir haben uns auf das Gesundheitswesen und die Pharmaindustrie konzentriert, sind jedoch offen für die Arbeit in zahlreichen Branchen.

Consulting-Fallstudien bei Fast Data Science

Zu den Projekten, an denen wir in der Vergangenheit gearbeitet haben, gehören unter anderem:

  • Ein Dashboard, das es der Öffentlichkeit ermöglicht, Umfrageantworten zu erkunden, die mithilfe von maschinellem Lernen automatisch kategorisiert wurden, für die White Ribbon Alliance . Dieses Dashboard wurde 2021 den Vereinten Nationen vorgestellt.
  • Ein unüberwachtes Lernmodell zur Erkennung wiederkehrender Themen und Fehler in den Herstellungs- und Lieferkettenprozessen für Boehringer Ingelheim . Die Fehler wurden in einfachem Englisch oder in der Landessprache der jeweiligen Einrichtung beschrieben.
  • Ein Vorhersagemodell in Microsoft Azure ML, das ermittelt hat, bei welchen Assistenzärzten (Praktikanten/Assistenzärzten) des britischen National Health Service (NHS) das Risiko besteht, dass sie das Unternehmen verlassen.
  • Ein Deep-Learning-Modell , ebenfalls in Azure ML, zum Kategorisieren von E-Mails von Kunden für das Information Commissioner’s Office .
  • Ein auf neuronalen Netzwerken basierendes Modell zum Extrahieren strukturierter Daten und Statistiken aus Protokollen klinischer Studien, auch für Boehringer Ingelheim.
  • Ein Vorhersagemodell, das neuronale Netzwerke verwendet, um Attribute aus den Lebensläufen von Arbeitssuchenden abzuleiten, bereitgestellt auf der Website der CV-Library .
  • Ein Modell, das die Online-Einkaufsbeträge von Kunden vorhersagt, für die britische Supermarktkette Tesco .

Interaktives Diagramm früherer Kunden

In unserem interaktiven Diagramm können Sie sehen und erkunden, woher unsere Kunden kommen und in welchen Branchen sie tätig sind.

.chart-logo {

    display: flex;

    justify-content: center;

}

.chart-logo>img {

    width: 300px;

}

.chart-logo {

    display: flex;

    justify-content: center;

}

.chart-logo>img {

    width: 300px;

}

<!--<div class="chart-logo"><img src="https://raw.githubusercontent.com/fastdatascience/logos/master/logo_transparent_background.png" width=40 /></div>-->

<div class="select-div">

    <label for="year">

        Select year

    </label>

    <select class="select-inp w-full" name="year" id="year" onchange="plot()">

        <option value="all">All</option>

        <option value="2020">2020</option>

        <option value="2021">2021</option>

    </select>

</div>

<div class="select-div my-6">

    <label for="metric">

        Explore Fast Data Science clients by

    </label>

    <select class="select-inp w-full" name="metric" id="metric" onchange="plot()">

        <option value="industry">Industry</option>

        <option value="region">Region</option>

        <option value="size">Size</option>

    </select>

</div>

<!-- Container for the visualization -->

<div id="vis"></div>

plot()

function plot() {

    let year = document.getElementById("year").value;

    let metric = document.getElementById("metric").value;

    let data = [{

            year: ['2020'],

            region: 'EU',

            industry: 'Healthcare',

            sector: 'Private',

            size: '\u00A0large (250+ employees)',

        },

        {

            year: ['2020'],

            region: 'UK',

            industry: 'Healthcare',

            sector: 'Private',

            size: '\u00A0large (250+ employees)',

        },

        {

            year: ['2020'],

            region: 'EU',

            industry: 'Finance',

            sector: 'Private',

            size: ' small (<50 employees)',

        },

        {

            year: ['2020'],

            region: 'UK',

            industry: 'Healthcare',

            sector: 'Private',

            size: ' micro (<10 employees)',

        },

        {

            year: ['2020', '2021'],

            region: 'US',

            industry: 'Nonprofit',

            sector: 'Nonprofit',

            size: 'medium (<250 employees)',

        },

        {

            year: ['2020'],

            region: 'UK',

            industry: 'Insurance',

            sector: 'Private',

            size: 'medium (<250 employees)',

        },

        {

            year: ['2020'],

            region: 'UK',

            industry: 'Finance',

            sector: 'Private',

            size: ' small (<50 employees)',

        },

        {

            year: ['2020'],

            region: 'US',

            industry: 'Technology',

            sector: 'Private',

            size: ' micro (<10 employees)',

        },

        {

            year: ['2020'],

            region: 'EU',

            industry: 'Energy',

            sector: 'Private',

            size: '\u00A0large (250+ employees)',

        },

        {

            year: ['2020'],

            region: 'UK',

            industry: 'Energy',

            sector: 'Private',

            size: 'medium (<250 employees)',

        },

        {

            year: ['2020', '2021'],

            region: 'UK',

            industry: 'Healthcare',

            sector: 'Private',

            size: 'medium (<250 employees)',

        },

        {

            year: ['2021'],

            region: 'UK',

            industry: 'Communication',

            sector: 'Public',

            size: '\u00A0large (250+ employees)',

        },

        {

            year: ['2020', '2021'],

            region: 'UK',

            industry: 'Technology',

            sector: 'Private',

            size: ' small (<50 employees)',

        },

    ];

    data = data.filter(company => {

        if (year == 'all') {

            return true

        } else {

            return company.year.includes(year)

        }

    });

    function extractData(feature) {

        let extractedData = [];

        let tempData = [];

        data.forEach(row => {

            tempData.push(row[feature])

        })

        tempData = [...new Set(tempData)].forEach(v => {

            t = {}

            t[metric] = v;

            t.count = tempData.filter(val => {

                return val == v

            }).length

            extractedData.push(t)

        });

        return extractedData;

    }

    data = extractData(metric);

    // Assign the specification to a local variable vlSpec.

    var vlSpec = {

        $schema: 'https://vega.github.io/schema/vega-lite/v5.json',

        data: {

            values: data

        },

        "config": {

            "axis": {

                "labelFont": "PT Sans",

                "titleFont": "PT Sans"

            },

            "legend": {

                "labelFont": "PT Sans",

                "titleFont": "PT Sans"

            },

            "header": {

                "labelFont": "PT Sans",

                "titleFont": "PT Sans"

            },

            "mark": {

                "font": "PT Sans"

            },

            "title": {

                "font": "PT Sans",

                "subtitleFont": "PT Sans"

            }

        },

        "width": 500,

        "height": 400,

        "mark": {

            "type": "bar",

            "filled": true,

            "tooltip": true

        },

        "encoding": {

            "x": {

                "field": metric,

                "type": "nominal",

                "axis": {

                    "labelAngle": 0

                }

            },

            "y": {

                "field": "count",

                "type": "quantitative",

                "axis": {

                    "tickMinStep": 1

                }

            }

        }

    };

    // Embed the visualization in the container with id `vis`

    vegaEmbed('#vis', vlSpec);

    console.log(data)

}

Weitere Fallstudien

  • Ein Empfehlungssystem, um Kandidaten Jobs für die CV-Library zu empfehlen.
  • Ein Modell zur Vorhersage der Entladezeit von Fahrzeugen , das zur Verbesserung der Genauigkeit der Logistikplanung für Lebensmittellieferungen, auch für Tesco, verwendet wird.
  • Ein auf einem Convolutional Neural Network basierendes Gesichtserkennungssystem, das für Android-, iOS- und Desktop-Apps entwickelt wurde und zur biometrischen Sicherheit verwendet wird.
  • Eine sprachgesteuerte Smart-Home-Anwendung.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us