Wir wurden von einem nationalen Grundbuchamt beauftragt, mittels NLP Grundbucheinträge zu interpretieren, die in unstrukturierter Rechtssprache verfasst sind.
Ein Problem, mit dem Grundbücher weltweit konfrontiert sind, ist sowohl die Digitalisierung älterer Grundbucheinträge als auch die Umwandlung des Freitextfelds, das einen Grundbucheintrag beschreibt, in strukturierte Daten. Ein nationales Grundbuchamt verfügt über strukturierte Kartendaten mit Polygonkoordinaten, aber der Grundbucheintrag ist ein Textdokument. Er enthält Informationen über den primären Besitz eines Grundstücks, etwaigen sekundären Besitz sowie Rechte der Eigentümer und Rechte anderer Parteien, wie etwa Mineralrechte.
Im Rahmen eines Engagements für eine KI-Strategie untersuchten wir das Potenzial von NLP und maschinellem Lernen für eine kanadische Wohnungsbaubehörde.
Wir haben an zwei externen Projekten teilgenommen, bei denen Open-Source-Code und -Daten produziert wurden, die der Öffentlichkeit für den persönlichen und kommerziellen Gebrauch zur Verfügung stehen.
Wir haben eine Python-Bibliothek namens Drug Named Entity Recognition als Open Source freigegeben, um Medikamentennamen in einer Zeichenfolge zu finden. Beispiel: „Ich habe Phenoxymethylpenicillin gekauft.“ Diese NLP-Aufgabe wird Named Entity Recognition (Medikamentennamen im Text finden) und Named Entity Linking (Medikamente IDs zuordnen) genannt.
Wir haben eine Python-Bibliothek namens Country Named Entity Recognition als Open Source freigegeben, um Ländernamen in einer Zeichenfolge zu finden. Beispiel: „Diese Studie wird Studienstandorte in Namibia, Simbabwe und Südafrika umfassen.“ Diese NLP-Aufgabe wird Named Entity Recognition (Länder im Text finden) und Named Entity Linking (Länder IDs zuordnen) genannt.
Harmony ist ein Open-Source-NLP-basiertes Datenharmonisierungstool, das für den Wellcome Data Prize entwickelt wurde.
Wir haben Harmony unter Verwendung der Verarbeitung natürlicher Sprache entwickelt, um es Forschern zu ermöglichen, in Zusammenarbeit mit der University of Ulster , dem University College London und der Universidade Federal de Santa Maria in Brasilien Metaanalysen von Studien zur psychischen Gesundheit für den Data Prize in Mental Health des Wellcome Trust durchzuführen . Weitere Informationen finden Sie auf der Projektwebsite .
Maschinelles Lernen in klinischen Studien: Wir haben für die Gates Foundation ein Tool zur Risikobewertung klinischer Studien unter Verwendung der Verarbeitung natürlicher Sprache entwickelt, um Experten dabei zu unterstützen, das Risiko eines nicht informativen Endes einer klinischen Studie abzuschätzen.
Das Office of Rail and Road (ORR) ist die britische nationale Eisenbahnregulierungsbehörde, die für Gesundheit und Sicherheit auf den Hauptstrecken des Schienenverkehrs, der Londoner U-Bahn, der Stadtbahn und der Straßenbahnen verantwortlich ist.
Skills Development Scotland (SDS) ist die nationale Organisation in Schottland, die Menschen dabei unterstützt, ihre Fähigkeiten zu entwickeln und anzuwenden. Es handelt sich um eine nicht ministeriumsgebundene öffentliche Einrichtung der schottischen Regierung.
Wie wir mithilfe eines Clustering-Algorithmus für die Verarbeitung natürlicher Sprache dem Pharmaunternehmen Boehringer Ingelheim dabei geholfen haben, Einblicke in seine Herstellungsprozesse zu gewinnen und Probleme zu erkennen. Das Pharmaunternehmen Boehringer Ingelheim stellt eine Reihe von Medikamenten gegen Diabetes und Krebs sowie Tiergesundheitsprodukte her. Boehringer verfügt über ein großes Netzwerk von Produktionsstätten auf der ganzen Welt. Medikamente können in einem Land synthetisiert, in einem anderen verpackt und zur Verteilung in ein Drittland verschifft werden.
Wir arbeiten mit Kunden auf der ganzen Welt zusammen, die Mehrheit unserer Kunden befindet sich jedoch im Vereinigten Königreich, gefolgt von den USA und dem übrigen Europa.
Wir haben uns auf das Gesundheitswesen und die Pharmaindustrie konzentriert, sind jedoch offen für die Arbeit in zahlreichen Branchen.
Zu den Projekten, an denen wir in der Vergangenheit gearbeitet haben, gehören unter anderem:
In unserem interaktiven Diagramm können Sie sehen und erkunden, woher unsere Kunden kommen und in welchen Branchen sie tätig sind.
.chart-logo {
display: flex;
justify-content: center;
}
.chart-logo>img {
width: 300px;
}
.chart-logo {
display: flex;
justify-content: center;
}
.chart-logo>img {
width: 300px;
}
<!--<div class="chart-logo"><img src="https://raw.githubusercontent.com/fastdatascience/logos/master/logo_transparent_background.png" width=40 /></div>-->
<div class="select-div">
<label for="year">
Select year
</label>
<select class="select-inp w-full" name="year" id="year" onchange="plot()">
<option value="all">All</option>
<option value="2020">2020</option>
<option value="2021">2021</option>
</select>
</div>
<div class="select-div my-6">
<label for="metric">
Explore Fast Data Science clients by
</label>
<select class="select-inp w-full" name="metric" id="metric" onchange="plot()">
<option value="industry">Industry</option>
<option value="region">Region</option>
<option value="size">Size</option>
</select>
</div>
<!-- Container for the visualization -->
<div id="vis"></div>
plot()
function plot() {
let year = document.getElementById("year").value;
let metric = document.getElementById("metric").value;
let data = [{
year: ['2020'],
region: 'EU',
industry: 'Healthcare',
sector: 'Private',
size: '\u00A0large (250+ employees)',
},
{
year: ['2020'],
region: 'UK',
industry: 'Healthcare',
sector: 'Private',
size: '\u00A0large (250+ employees)',
},
{
year: ['2020'],
region: 'EU',
industry: 'Finance',
sector: 'Private',
size: ' small (<50 employees)',
},
{
year: ['2020'],
region: 'UK',
industry: 'Healthcare',
sector: 'Private',
size: ' micro (<10 employees)',
},
{
year: ['2020', '2021'],
region: 'US',
industry: 'Nonprofit',
sector: 'Nonprofit',
size: 'medium (<250 employees)',
},
{
year: ['2020'],
region: 'UK',
industry: 'Insurance',
sector: 'Private',
size: 'medium (<250 employees)',
},
{
year: ['2020'],
region: 'UK',
industry: 'Finance',
sector: 'Private',
size: ' small (<50 employees)',
},
{
year: ['2020'],
region: 'US',
industry: 'Technology',
sector: 'Private',
size: ' micro (<10 employees)',
},
{
year: ['2020'],
region: 'EU',
industry: 'Energy',
sector: 'Private',
size: '\u00A0large (250+ employees)',
},
{
year: ['2020'],
region: 'UK',
industry: 'Energy',
sector: 'Private',
size: 'medium (<250 employees)',
},
{
year: ['2020', '2021'],
region: 'UK',
industry: 'Healthcare',
sector: 'Private',
size: 'medium (<250 employees)',
},
{
year: ['2021'],
region: 'UK',
industry: 'Communication',
sector: 'Public',
size: '\u00A0large (250+ employees)',
},
{
year: ['2020', '2021'],
region: 'UK',
industry: 'Technology',
sector: 'Private',
size: ' small (<50 employees)',
},
];
data = data.filter(company => {
if (year == 'all') {
return true
} else {
return company.year.includes(year)
}
});
function extractData(feature) {
let extractedData = [];
let tempData = [];
data.forEach(row => {
tempData.push(row[feature])
})
tempData = [...new Set(tempData)].forEach(v => {
t = {}
t[metric] = v;
t.count = tempData.filter(val => {
return val == v
}).length
extractedData.push(t)
});
return extractedData;
}
data = extractData(metric);
// Assign the specification to a local variable vlSpec.
var vlSpec = {
$schema: 'https://vega.github.io/schema/vega-lite/v5.json',
data: {
values: data
},
"config": {
"axis": {
"labelFont": "PT Sans",
"titleFont": "PT Sans"
},
"legend": {
"labelFont": "PT Sans",
"titleFont": "PT Sans"
},
"header": {
"labelFont": "PT Sans",
"titleFont": "PT Sans"
},
"mark": {
"font": "PT Sans"
},
"title": {
"font": "PT Sans",
"subtitleFont": "PT Sans"
}
},
"width": 500,
"height": 400,
"mark": {
"type": "bar",
"filled": true,
"tooltip": true
},
"encoding": {
"x": {
"field": metric,
"type": "nominal",
"axis": {
"labelAngle": 0
}
},
"y": {
"field": "count",
"type": "quantitative",
"axis": {
"tickMinStep": 1
}
}
}
};
// Embed the visualization in the container with id `vis`
vegaEmbed('#vis', vlSpec);
console.log(data)
}
What we can do for you