Die Verarbeitung natürlicher Sprache ist ein Teilgebiet der Linguistik und steht an der Schnittstelle von Informatik, künstlicher Intelligenz und Ingenieurwissenschaften. NLP ist seit den 1950er Jahren ein aktives Feld der wissenschaftlichen Forschung. Im Jahr 1950 veröffentlichte Alan Turing einen Artikel mit dem Titel „Computing Machinery and Intelligence“, in dem er den sogenannten Turing-Test als Intelligenzkriterium vorschlug, eine Aufgabe, die die automatisierte Interpretation und Generierung natürlicher Sprache beinhaltet (z. B. „Wir suchen in die Datenbank"). Zu dieser Zeit wurde NLP noch nicht als eigenständiges Wissenschaftsgebiet innerhalb oder getrennt von der künstlichen Intelligenz angesehen, obwohl NLP heute vollständig als eigenständige Wissenschaft anerkannt ist. NLP-Wissenschaftler unterhalten ihre eigenen Zeitschriften und Konferenzen, und das Fachgebiet ist seit der vielbeachteten Veröffentlichung von Siri und anderen NLP-Anwendungen, mit denen der Verbraucher täglich interagiert, in der Öffentlichkeit bekannt geworden.
NLP-Wissenschaftler experimentieren mit verschiedenen Modellarchitekturen und Hyperparametern, bevor sie ein Modell auswählen, das bei einer bestimmten Metrik die beste Leistung erbringt
Die Wissenschaftler von Fast Data Science konzentrieren sich auf die Verarbeitung natürlicher Sprache (NLP). Der Manager, Thomas Wood, absolvierte 2008 einen Master in Computersprache, Text und Internettechnologie an der Universität Cambridge und führte sein NLP-Wissenschaftsprojekt zu pleonastischen Pronomen mithilfe von unüberwachtem Lernen durch. Mit anderen Worten: Er konzentrierte sich darauf, herauszufinden, welche Vorkommen des Wortes „es“ sich auf einen Referenten im vorherigen Satz beziehen. Wenn „es“ kein Referent hat, wie zum Beispiel „es regnet“, spricht man von einem pleonastischen Pronomen . Es gibt sie auch auf Französisch und Deutsch, jedoch nicht auf Spanisch. Wer hätte gedacht, dass ein aus zwei Buchstaben bestehendes Wort so viel Ärger verursachen würde? Seitdem beschäftigt er sich ausschließlich mit maschinellem Lernen und hauptsächlich mit NLP, hat seinen Horizont jedoch über das Wort „es“ hinaus erweitert. Im Jahr 2018 gründete er Fast Data Science Ltd, um datenwissenschaftliche Beratung und Fachwissen von NLP-Wissenschaftlern anzubieten. Unser Team aus hochqualifizierten NLP-Wissenschaftlern hat NLP-Pipelines von Grund auf aufgebaut und an Dialogsystemen in natürlicher Sprache , Dokumentenklassifikatoren und textbasierten Empfehlungssystemen gearbeitet. Für diese Aufgaben haben wir sowohl traditionelle Techniken des maschinellen Lernens als auch modernste Techniken wie neuronale Netze eingesetzt. Unsere NLP-Wissenschaftler verwenden normalerweise Python .
Fast Data Science - London
NLP-Wissenschaftler konzentrieren sich auf eine Vielzahl von Teilbereichen des NLP, darunter:
Heutzutage verfügen viele Unternehmen, insbesondere in bestimmten Branchen wie dem Gesundheitswesen, der Pharmaindustrie, der Rechts- und Versicherungsbranche, über große Mengen unstrukturierter Daten. Hierbei handelt es sich typischerweise um Daten im Textformat, bei denen es sich auch um nicht gescannte Dokumente, PDFs, HTML oder andere Dateitypen handeln kann.
Unstrukturierte Daten sind sehr schwer zu handhaben, können aber eine Goldgrube an Informationen enthalten. Fast Data Science ist darauf spezialisiert, Mehrwert aus den unstrukturierten Datensätzen von Unternehmen zu ziehen. Wenn Sie in Ihrer Organisation über einen großen Dokumentensatz verfügen, sollten Sie die Beauftragung eines Beratungsunternehmens mit NLP-Wissenschaftlern wie Fast Data Science in Betracht ziehen.
NLP breitet sich branchenübergreifend aus, aber nirgendwo ist dies stärker der Fall als im Gesundheitssektor. Healthtech und MedTech sind wichtige Bereiche der wissenschaftlichen NLP-Forschung.
NLP-Wissenschaftler nutzen NLP, um Änderungen in klinischen Berichten zu vergleichen und zu erkennen, klinische Konzepte wie MeSH-Begriffe aus elektronischen Krankenakten zu extrahieren und Dialogsysteme zwischen Mensch und Maschine in natürlicher Sprache zu entwickeln, um das Gesundheitserlebnis zu verbessern. Diese Durchbrüche in der NLP-Forschung beginnen sich auf die Branche auszuwirken. Schauen Sie sich einige unserer Arbeiten im Gesundheitswesen in unserem Portfolio an.
Wir haben an einer Reihe von NLP-Forschungsprojekten im Gesundheitswesen gearbeitet, darunter:
Unsere NLP-Wissenschaftler konzentrieren sich auf jede Art von NLP-Modell. Einige Beispiele sind:
* convolutional neural networks (text as well as images)
* RNN, LSTM
* Seq2seq, word2vec, doc2vec
* [see a live demo of a CNN for author identification](http://fastdatascience.com/author-prediction-demo/)
* This is useful for extracting topics from a set of unstructured documents, for example, legal documents, survey responses, factory error reports, etc.
Die Themenerkennung ist die bevorzugte Technik eines NLP-Wissenschaftlers, mit der Sie häufige Themen in einer Reihe unstrukturierter Dokumente entdecken können.
Wir arbeiten mit folgenden Programmiersprachen und Frameworks:
Zu den NLP-Projekten, an denen wir für große bekannte Namen gearbeitet haben, gehören:
What we can do for you