Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!
Finden Sie Ihren TraumjobEine Regel für das Establishment, eine andere für alle anderen …
Owen Jones, Der Wächter
Wenn Sie im Vereinigten Königreich leben, wird es schwierig gewesen sein, die Medienberichterstattung über Dominic Cummings‘ Reise nach Durham kurz nach Beginn der Coronavirus-Sperrung zu vermeiden.
Was viele Briten noch mehr verärgerte, war seine im Fernsehen übertragene Erklärung , die er am 25. Mai im Rose Garden in Downing St. 10 hielt. Viele erwarteten eine Entschuldigung für die Missachtung der strengen Lockdown-Regeln, hörten aber stattdessen eine Reihe lauer Ausreden.
Dominic Cummings liest seine Erklärung im Rosengarten bei Nummer 10
Dann führte Allen Green von der Financial Times eine faszinierende Analyse darüber durch, wie der Wortlaut der Erklärung von einem Anwalt zusammengestellt wurde, und nannte mindestens drei Gründe für jede Handlung, für den Fall, dass eine Behauptung später widerlegt wird.
Fast Data Science - London
Da habe ich mich gefragt: Hat Cummings seine Erklärung geschrieben oder seine Anwälte ?
Ich habe versucht, dies mithilfe der forensischen Stilometrie herauszufinden, der Wissenschaft, Autoren anhand ihres Schreibstils zu identifizieren.
Auf meinem Computer lag Code aus einem früheren Experiment, bei dem ich untersuchte, ob JK Rowling tatsächlich „Der Ruf des Kuckucks“ geschrieben hat . Ich habe Beiträge aus dem Blog von Cummings und einigen anderen berühmten Persönlichkeiten aus Politik und Öffentlichkeit gesammelt und die Ähnlichkeit zwischen den Schreibstilen berechnet. (Wenn Sie es übrigens schaffen, einen der langen Beiträge auf seinem Blog von Anfang bis Ende zu lesen, werde ich beeindruckt sein.)
Als ich die Wahrscheinlichkeit berechnete, dass Cummings der Autor ist, waren die Ergebnisse nicht schlüssig. Mein Modell gab eine Wahrscheinlichkeit von etwa 50 % an, dass er seine Aussage geschrieben hat. Er war ein wahrscheinlicherer Autor als jeder meiner anderen Kandidaten.
Wahrscheinlichkeit wahrscheinlicher Autoren der Rose Garden-Erklärung, basierend auf den Blogbeiträgen und Schriften von Persönlichkeiten und berechnet mit dem Burrows-Delta- Algorithmus .
Ich denke, dass die Realität irgendwo in der Mitte liegt. Cummings hat die Erklärung wahrscheinlich verfasst und seine Anwälte haben sie rechtssicher gemacht. Die Stilometrieanalyse deutet darauf hin, dass er höchstwahrscheinlich zumindest einen gewissen Beitrag geleistet hat. Dies würde es zu einer gemeinsamen Anstrengung machen.
Wenn Sie über eine Reihe von Dokumenten verfügen und die Urheberschaft ermitteln oder einfach nur Daten daraus extrahieren möchten, würde ich mich über eine Nachricht von Ihnen freuen. Schreibe einfach einen Kommentar oder sende mir eine Nachricht .
Leider ist die Delta- Stilometriemethode von Burrows, die ich verwendet habe, bei längeren Texten wie Büchern tendenziell am besten geeignet. Es wurden Stilometrietechniken erforscht, die Deep Learning und Wortvektoren verwenden (Jasper et al.) und in der Lage sind, die Urheberschaft von kurzen Dokumenten zu identifizieren, allerdings ist dies viel schwieriger als das Burrows-Delta.
Tauchen Sie ein in die Welt der Natürlichen Sprachverarbeitung! Entdecken Sie modernste NLP-Rollen, die zu Ihren Fähigkeiten und Leidenschaften passen.
NLP-Jobs entdeckenMittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.
Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.
Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.
What we can do for you