Büro des Informationskommissars – ML-E-Mail-Klassifizierungsmodell

Büro des Informationskommissars – ML-E-Mail-Klassifizierungsmodell

Fined Facebook £500k

900,000 fee payers

Upholds GDPR and other data protection legislation

ICO: E-Mail-Klassifizierung

Das Information Commissioner’s Office (ICO) ist die öffentliche Einrichtung, die für die Regulierung des Datenschutzes im Vereinigten Königreich zuständig ist. Die Mission des ICO besteht darin, „Informationsrechte im öffentlichen Interesse zu wahren und die Offenheit öffentlicher Stellen sowie den Datenschutz für Einzelpersonen zu fördern“. Organisationen und Freiberufler im gesamten Vereinigten Königreich müssen sich registrieren und eine monatliche Gebühr an das ICO zahlen, wenn sie personenbezogene Daten verarbeiten.

Fast Data Science - London

Need a business solution?

Seit 2016 führend in den Bereichen NLP, ML und Data Science – kontaktieren Sie uns für eine NLP-Beratungssitzung.

Das ICO erhält eine große Menge an E-Mails von Kunden, bei denen es sich um große multinationale Unternehmen oder kleine Freiberufler handeln kann. Das ICO benötigte ein maschinelles Lernmodell, um die E-Mails für seine internen Prozesse zu kategorisieren.

Fast Data Science nutzte Microsoft Azure ML, um ein maschinelles Lernmodell zu trainieren, das eingehende E-Mails in eine Reihe von Kategorien kategorisiert und es dem ICO ermöglicht, diese effizienter zu verarbeiten.

Datenschutz und Privatsphäre

Das ICO-Projekt war insbesondere deshalb eine Herausforderung, weil das maschinelle Lernmodell auf sensible Daten trainiert werden musste, die nicht gespeichert oder dupliziert werden konnten. Aus diesem Grund mussten wir alle Trainingsdaten mit größter Sorgfalt behandeln und sicherstellen, dass sie nur zum Training des Modells verwendet wurden, nicht gespeichert wurden und die isolierte Trainingsumgebung nicht verließen.

In diesem Blogbeitrag können Sie mehr über die Ansätze lesen, die wir bei Fast Data Science verwenden, um Modelle für maschinelles Lernen auf sensible Daten zu trainieren.

Grundlagen der E-Mail-Klassifizierung durch maschinelles Lernen

Im Allgemeinen kann die E-Mail-Klassifizierung durch maschinelles Lernen verschiedene Anwendungen haben, z. B. Spam-Filterung, Kundensupport, Stimmungsanalyse und Informationsabruf. Es gibt viele verschiedene ML-E-Mail-Klassifizierungsmethoden und -techniken, wie z. B. Merkmalsextraktion, Merkmalsauswahl, Textvorverarbeitung und überwachte oder unbeaufsichtigte Lernalgorithmen.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us