Wir wurden von einem nationalen Grundbuchamt beauftragt, mittels NLP Grundbucheinträge zu interpretieren, die in unstrukturierter Rechtssprache verfasst sind.
Ein Problem, mit dem Grundbücher weltweit konfrontiert sind, ist sowohl die Digitalisierung älterer Grundbucheinträge als auch die Umwandlung des Freitextfelds, das einen Grundbucheintrag beschreibt, in strukturierte Daten. Ein nationales Grundbuchamt verfügt über strukturierte Kartendaten mit Polygonkoordinaten, aber der Grundbucheintrag ist ein Textdokument. Er enthält Informationen über den primären Besitz eines Grundstücks, etwaigen sekundären Besitz sowie Rechte der Eigentümer und Rechte anderer Parteien, wie etwa Mineralrechte.
Dies geschieht in Form mehrerer Sätze eines sehr unstrukturierten Textes, der uns einen Abdruck der Geschichte des Titels über die Jahrhunderte hinweg liefert. Beispielsweise könnte ein Haus in einer Stadt auf einem Bauernhof gebaut worden sein, der vor einem Jahrhundert für die Bebauung parzelliert wurde, und der Grundstückstitel enthält Verweise auf das viel größere Grundstück des ursprünglichen Bauernhofs und das kleinere Grundstück des bestehenden Hauses.
Fast Data Science - London
Das Grundbuchamt verfügte außerdem über einen großen georäumlichen Datensatz, in dem die Koordinaten von Titeln und Titelteilen gespeichert waren. Wir haben an einem NLP-Projekt gearbeitet, um den Abschnitt eines Grundstückstitels im Klartext zu identifizieren, der sich auf den primären Eigentümer bezieht, sodass Teile des Titeltexts mit entsprechenden Polygonen in einer Kartendatei verknüpft werden können. Wir haben verschiedene maschinelle Lerntechniken verwendet, darunter Deep-Learning-Modelle auf Microsoft Azure, um den Text dem primären Eigentumspolygon für neue, noch nicht angezeigte Grundstückstitel zuzuordnen.
Gemeinsam mit dem Team des Grundbuchamts erstellten wir ein Demo-Web-Frontend, in dem ein Benutzer einen Grundbucheintrag eingeben und die Ergebnisse der Analyse mit einem Vertrauenswert anzeigen konnte. Dies reichte dem Grundbuchamt aus, um mit der weiteren Analyse seines Datensatzes an Grundbucheinträgen mithilfe natürlicher Sprachverarbeitung fortzufahren.
Nach dem Proof of Concept ging das Grundbuchamt zu weiteren Entwicklungssprints über, um mehr angereicherte Daten aus seiner Grundbuchdatenbank zu extrahieren. Dies sollte eine bessere Benutzererfahrung für Grundbuchanwälte bieten, die einen Grundbucheintrag mit strukturierten Kartendaten abgleichen möchten, und eine schnelle Suche, Informationsabfrage und statistische Analyse ermöglichen.
Wenn Sie über eine große Anzahl unstrukturierter Textdokumente verfügen und Fast Data Science Sie bei der Themenfindung, Clusteranalyse oder einer anderen NLP-Analyse unterstützen soll, nehmen Sie bitte Kontakt mit uns auf .
What we can do for you