Kann die Stilometrie sagen, wer die kontroverse Aussage von Dominic Cummings geschrieben hat?

· Thomas Wood
Kann die Stilometrie sagen, wer die kontroverse Aussage von Dominic Cummings geschrieben hat?

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Eine Regel für das Establishment, eine andere für alle anderen …

Owen Jones, Der Wächter

Dominic Cummings Aussage im Rosengarten

Wenn Sie im Vereinigten Königreich leben, wird es schwierig gewesen sein, die Medienberichterstattung über Dominic Cummings‘ Reise nach Durham kurz nach Beginn der Coronavirus-Sperrung zu vermeiden.

Was viele Briten noch mehr verärgerte, war seine im Fernsehen übertragene Erklärung , die er am 25. Mai im Rose Garden in Downing St. 10 hielt. Viele erwarteten eine Entschuldigung für die Missachtung der strengen Lockdown-Regeln, hörten aber stattdessen eine Reihe lauer Ausreden.

Verdacht auf den Schreibstil der Financial Times

Dominic Cummings liest seine Erklärung im Rosengarten bei Nummer 10

Dann führte Allen Green von der Financial Times eine faszinierende Analyse darüber durch, wie der Wortlaut der Erklärung von einem Anwalt zusammengestellt wurde, und nannte mindestens drei Gründe für jede Handlung, für den Fall, dass eine Behauptung später widerlegt wird.

Fast Data Science - London

Need a business solution?

NLP , ML und Data Science Leader seit 2016 – kontaktieren Sie uns für eine NLP- Beratungssitzung.

Da habe ich mich gefragt: Hat Cummings seine Erklärung geschrieben oder seine Anwälte ?

Forensische Stilometrieanalyse

Ich habe versucht, dies mithilfe der forensischen Stilometrie herauszufinden, der Wissenschaft, Autoren anhand ihres Schreibstils zu identifizieren.

Auf meinem Computer lag Code aus einem früheren Experiment, bei dem ich untersuchte, ob JK Rowling tatsächlich „Der Ruf des Kuckucks“ geschrieben hat . Ich habe Beiträge aus dem Blog von Cummings und einigen anderen berühmten Persönlichkeiten aus Politik und Öffentlichkeit gesammelt und die Ähnlichkeit zwischen den Schreibstilen berechnet. (Wenn Sie es übrigens schaffen, einen der langen Beiträge auf seinem Blog von Anfang bis Ende zu lesen, werde ich beeindruckt sein.)

Als ich die Wahrscheinlichkeit berechnete, dass Cummings der Autor ist, waren die Ergebnisse nicht schlüssig. Mein Modell gab eine Wahrscheinlichkeit von etwa 50 % an, dass er seine Aussage geschrieben hat. Er war ein wahrscheinlicherer Autor als jeder meiner anderen Kandidaten.

[Stylometry](/fast-stylometry-python-library) model output. Probability of likely authors of the Rose Garden statement

Wahrscheinlichkeit wahrscheinlicher Autoren der Rose Garden-Erklärung, basierend auf den Blogbeiträgen und Schriften von Persönlichkeiten und berechnet mit dem Burrows-Delta- Algorithmus .

Wer hat es wirklich geschrieben?

Ich denke, dass die Realität irgendwo in der Mitte liegt. Cummings hat die Erklärung wahrscheinlich verfasst und seine Anwälte haben sie rechtssicher gemacht. Die Stilometrieanalyse deutet darauf hin, dass er höchstwahrscheinlich zumindest einen gewissen Beitrag geleistet hat. Dies würde es zu einer gemeinsamen Anstrengung machen.

Wenn Sie über eine Reihe von Dokumenten verfügen und die Urheberschaft ermitteln oder einfach nur Daten daraus extrahieren möchten, würde ich mich über eine Nachricht von Ihnen freuen. Schreibe einfach einen Kommentar oder sende mir eine Nachricht .

Leider ist die Delta- Stilometriemethode von Burrows, die ich verwendet habe, bei längeren Texten wie Büchern tendenziell am besten geeignet. Es wurden Stilometrietechniken erforscht, die Deep Learning und Wortvektoren verwenden (Jasper et al.) und in der Lage sind, die Urheberschaft von kurzen Dokumenten zu identifizieren, allerdings ist dies viel schwieriger als das Burrows-Delta.

Verweise

  • Jasper et al, Authorship Verification on Short Text Samples Using Stylometric Embeddings, Lecture Notes in Computer Science (2018)
  • Evert et al, Towards a better understanding of Burrows’s Delta in literary authorship attribution, Proceedings of NAACL-HLT (2015)

Entdecken Sie Ihre Zukunft in NLP!

Tauchen Sie ein in die Welt der Natürlichen Sprachverarbeitung! Entdecken Sie modernste NLP-Rollen, die zu Ihren Fähigkeiten und Leidenschaften passen.

NLP-Jobs entdecken

Big-Data-Beratung – 4 häufigste Probleme gelöst
Data scienceBig data

Big-Data-Beratung – 4 häufigste Probleme gelöst

Mittlerweile sind es Organisationen aller Größenordnungen und fast aller Sektoren werden zunehmend datengesteuert, insbesondere als größere Datenspeicher Systeme und schnellere Computer treiben die Leistungsgrenzen immer weiter voran.

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution
Ai and societyData science

Zwei Revolutionen im Abstand von 200 Jahren: die Datenrevolution und die industrielle Revolution

Aufgrund des umfangreichen Einsatzes von Technologie und der Arbeitsteilung hat die Arbeit des durchschnittlichen Gig-Economy-Arbeiters jeden individuellen Charakter und damit auch jeden Charme für den Arbeitnehmer verloren.

KI im Personalwesen: Die Zukunft der Arbeit verändern
Ai and societyData science

KI im Personalwesen: Die Zukunft der Arbeit verändern

Die Auswirkungen von KI auf die Humanressourcen Die Arbeitswelt verändert sich rasant, sowohl aufgrund der Einführung traditioneller Data-Science-Praktiken in immer mehr Unternehmen als auch aufgrund der zunehmenden Beliebtheit generativer KI-Tools wie ChatGPT und Googles BARD bei nicht-technischen Arbeitnehmern.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us