Suchen Sie Experten in Natürlicher Sprachverarbeitung? Veröffentlichen Sie Ihre Stellenangebote bei uns und finden Sie heute Ihren idealen Kandidaten!
Veröffentlichen Sie einen JobEine Regel für das Establishment, eine andere für alle anderen …
Owen Jones, The Guardian
Wer in Großbritannien lebt, wird der Medienberichterstattung über Dominic Cummings‘ Reise nach Durham kurz nach Beginn der Coronavirus-Sperre kaum entgehen können.
Was viele Briten noch mehr erzürnte, war seine im Fernsehen übertragene Erklärung vom 25. Mai aus dem Rosengarten in Downing Street 10. Viele hatten eine Entschuldigung für die Missachtung der strengen Lockdown-Regeln erwartet, bekamen aber stattdessen eine Reihe lauwarmer Ausreden zu hören.
Dominic Cummings verliest seine Erklärung im Rosengarten der Downing Street 10
Anschließend legte Allen Green in der Financial Times eine faszinierende Analyse vor, wie der Wortlaut der Erklärung von einem Anwalt zusammengestellt wurde, wobei für jede Maßnahme mindestens drei Gründe angegeben wurden für den Fall, dass eine Behauptung später widerlegt wird.
Fast Data Science - London
Das brachte mich zum Nachdenken: Haben Cummings oder seine Anwälte seine Erklärung geschrieben?
Ich habe versucht, dies mithilfe der forensischen Stilometrie herauszufinden, der Wissenschaft der Identifizierung von Autoren anhand ihres Schreibstils.
Auf meinem Computer lag noch Code von einem früheren Experiment, bei dem ich untersucht hatte, ob JK Rowling wirklich „Der Ruf des Kuckucks“ geschrieben hatte . Ich sammelte Beiträge aus Cummings‘ Blog und von einigen anderen berühmten Persönlichkeiten aus Politik und öffentlichem Leben und berechnete die Ähnlichkeit zwischen den Schreibstilen. (Übrigens: Wenn Sie es schaffen, einen der langen Beiträge in seinem Blog von Anfang bis Ende zu lesen, werde ich beeindruckt sein.)
Als ich die Wahrscheinlichkeit berechnete, dass Cummings der Autor war, waren die Ergebnisse nicht eindeutig. Mein Modell ergab eine Wahrscheinlichkeit von etwa 50 %, dass er seine Aussage geschrieben hatte. Er war ein wahrscheinlicherer Autor als alle meine anderen Kandidaten.
Wahrscheinlichkeit der wahrscheinlichen Autoren der Rose Garden-Erklärung, basierend auf Blog-Posts und Schriften von Persönlichkeiten und berechnet mit dem Burrows-Delta- Algorithmus .
Ich denke, die Realität liegt irgendwo dazwischen. Cummings hat die Erklärung wahrscheinlich verfasst und seine Anwälte haben sie juristisch wasserdicht gemacht. Die Stilometrie- Analyse deutet darauf hin, dass er höchstwahrscheinlich zumindest einen gewissen Beitrag geleistet hat. Dies würde bedeuten, dass es sich um eine Gemeinschaftsarbeit handelt.
Wenn Sie über eine Reihe von Dokumenten verfügen und die Urheberschaft ermitteln oder einfach Daten daraus extrahieren möchten, würde ich mich über Ihre Nachricht freuen. Schreiben Sie einfach einen Kommentar oder senden Sie mir eine Nachricht .
Leider funktioniert die von mir verwendete Burrows-Delta-Methode der Stilometrie am besten bei längeren Texten wie Büchern. Es gibt Forschungen zu Stilometrietechniken , die Deep Learning und Wortvektoren verwenden (Jasper et al.), und die in der Lage sind, die Urheberschaft kurzer Dokumente zu identifizieren, dies ist jedoch viel schwieriger als Burrows-Delta.
Bereit für den nächsten Schritt in Ihrer NLP-Reise? Vernetzen Sie sich mit Top-Arbeitgebern, die Talente in der natürlichen Sprachverarbeitung suchen. Entdecken Sie Ihren Traumjob!
Finden Sie Ihren TraumjobGenerative KI Einführung Generative KI , ein Teilbereich der KI, verändert Branchen grundlegend und gestaltet die Zukunft. Durch die Nutzung fortschrittlicher Algorithmen kann generative KI Inhalte, Designs und Lösungen erstellen, die zuvor undenkbar waren.
Große Daten Das Aufkommen von Big Data hat ganze Branchen revolutioniert und traditionelle Geschäftsmodelle und Entscheidungsprozesse verändert. In dieser umfassenden Untersuchung gehen wir der Frage nach, was Big Data ist, welche erheblichen Auswirkungen es auf die Geschäftsstrategie hat und wie Unternehmen riesige Datenmengen nutzen können, um Innovationen voranzutreiben und sich einen Wettbewerbsvorteil zu verschaffen.
What we can do for you