Kann die Stilometrie sagen, wer die kontroverse Aussage von Dominic Cummings geschrieben hat?

· Thomas Wood
Kann die Stilometrie sagen, wer die kontroverse Aussage von Dominic Cummings geschrieben hat?

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Eine Regel für das Establishment, eine andere für alle anderen …

Owen Jones, The Guardian

Dominic Cummings Erklärung im Rosengarten

Wer in Großbritannien lebt, wird der Medienberichterstattung über Dominic Cummings‘ Reise nach Durham kurz nach Beginn der Coronavirus-Sperre kaum entgehen können.

Was viele Briten noch mehr erzürnte, war seine im Fernsehen übertragene Erklärung vom 25. Mai aus dem Rosengarten in Downing Street 10. Viele hatten eine Entschuldigung für die Missachtung der strengen Lockdown-Regeln erwartet, bekamen aber stattdessen eine Reihe lauwarmer Ausreden zu hören.

Misstrauen gegenüber dem Schreibstil der Financial Times

Dominic Cummings verliest seine Erklärung im Rosengarten der Downing Street 10

Anschließend legte Allen Green in der Financial Times eine faszinierende Analyse vor, wie der Wortlaut der Erklärung von einem Anwalt zusammengestellt wurde, wobei für jede Maßnahme mindestens drei Gründe angegeben wurden für den Fall, dass eine Behauptung später widerlegt wird.

Fast Data Science - London

Need a business solution?

Führend in den Bereichen NLP , ML und Data Science seit 2016 – kontaktieren Sie uns für eine NLP- Beratungssitzung.

Das brachte mich zum Nachdenken: Haben Cummings oder seine Anwälte seine Erklärung geschrieben?

Forensische Stilometrie-Analyse

Ich habe versucht, dies mithilfe der forensischen Stilometrie herauszufinden, der Wissenschaft der Identifizierung von Autoren anhand ihres Schreibstils.

Auf meinem Computer lag noch Code von einem früheren Experiment, bei dem ich untersucht hatte, ob JK Rowling wirklich „Der Ruf des Kuckucks“ geschrieben hatte . Ich sammelte Beiträge aus Cummings‘ Blog und von einigen anderen berühmten Persönlichkeiten aus Politik und öffentlichem Leben und berechnete die Ähnlichkeit zwischen den Schreibstilen. (Übrigens: Wenn Sie es schaffen, einen der langen Beiträge in seinem Blog von Anfang bis Ende zu lesen, werde ich beeindruckt sein.)

Als ich die Wahrscheinlichkeit berechnete, dass Cummings der Autor war, waren die Ergebnisse nicht eindeutig. Mein Modell ergab eine Wahrscheinlichkeit von etwa 50 %, dass er seine Aussage geschrieben hatte. Er war ein wahrscheinlicherer Autor als alle meine anderen Kandidaten.

[Stylometry](/natural-language-processing/fast-stylometry-python-library/) model output. Probability of likely authors of the Rose Garden statement

Wahrscheinlichkeit der wahrscheinlichen Autoren der Rose Garden-Erklärung, basierend auf Blog-Posts und Schriften von Persönlichkeiten und berechnet mit dem Burrows-Delta- Algorithmus .

Wer hat es wirklich geschrieben?

Ich denke, die Realität liegt irgendwo dazwischen. Cummings hat die Erklärung wahrscheinlich verfasst und seine Anwälte haben sie juristisch wasserdicht gemacht. Die Stilometrie- Analyse deutet darauf hin, dass er höchstwahrscheinlich zumindest einen gewissen Beitrag geleistet hat. Dies würde bedeuten, dass es sich um eine Gemeinschaftsarbeit handelt.

Wenn Sie über eine Reihe von Dokumenten verfügen und die Urheberschaft ermitteln oder einfach Daten daraus extrahieren möchten, würde ich mich über Ihre Nachricht freuen. Schreiben Sie einfach einen Kommentar oder senden Sie mir eine Nachricht .

Leider funktioniert die von mir verwendete Burrows-Delta-Methode der Stilometrie am besten bei längeren Texten wie Büchern. Es gibt Forschungen zu Stilometrietechniken , die Deep Learning und Wortvektoren verwenden (Jasper et al.), und die in der Lage sind, die Urheberschaft kurzer Dokumente zu identifizieren, dies ist jedoch viel schwieriger als Burrows-Delta.

Verweise

  • Jasper et al., Autorschaftsüberprüfung an kurzen Textproben mittels stilometrischer Einbettungen , Vorlesungsunterlagen in Informatik (2018)
  • Evert et al., Auf dem Weg zu einem besseren Verständnis von Burrows' Delta bei der literarischen Urheberschaftszuordnung , Proceedings of NAACL-HLT (2015)

Ihre NLP-Karriere wartet!

Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!

Finden Sie Ihren Traumjob

Generative KI
Generative ki

Generative KI

Generative KI Einführung Generative KI , ein Teilbereich der KI, verändert Branchen grundlegend und gestaltet die Zukunft. Durch die Nutzung fortschrittlicher Algorithmen kann generative KI Inhalte, Designs und Lösungen erstellen, die zuvor undenkbar waren.

Große Daten
Große daten

Große Daten

Große Daten Das Aufkommen von Big Data hat ganze Branchen revolutioniert und traditionelle Geschäftsmodelle und Entscheidungsprozesse verändert. In dieser umfassenden Untersuchung gehen wir der Frage nach, was Big Data ist, welche erheblichen Auswirkungen es auf die Geschäftsstrategie hat und wie Unternehmen riesige Datenmengen nutzen können, um Innovationen voranzutreiben und sich einen Wettbewerbsvorteil zu verschaffen.

KI im Finanzwesen
Ki im finanzwesen

KI im Finanzwesen

KI im Finanzwesen Die Integration künstlicher Intelligenz (KI) in den Finanzsektor hat die Arbeitsweise von Institutionen revolutioniert, von der Automatisierung von Abläufen bis hin zur Verbesserung der Kundenbindung und des Risikomanagements.

What we can do for you

Transform Unstructured Data into Actionable Insights

Contact us