Zum Inhalt springen

Topic Modeling

Topic Modeling ist ein in der Informatik entwickeltes Verfahren, mit dessen Hilfe große Datenmengen erschlossen werden können. Damit können besonders gut Themen aus Sachtexten extrahiert werden, da es auf Grundlage großer Zeitungskorpora entwickelt wurde. Vor der Anwendung der Methode auf literarische Texte muss ein entsprechender, meist auf Zeitungskorpora aufbauender Algorithmus jedoch angepasst werden. Das Topic Modeling basiert auf der Kookkurrenzanalyse: Es wird nach Wörtern gesucht, die überdurchschnittlich häufig gemeinsam auftauchen. Diese Wortpaare oder -gruppen werden in einem zweiten Schritt extrahiert und nach Themen klassifiziert. Im Fall von literarischen Texten sind diese ‚Themen‘ jedoch keine Themen im klassischen Sinne, sondern eher Topoi des Erzählens – beispielsweise das Cluster ‚Wasser, Boot, Brandung‘.

David M. Blei: „Topic Modeling and Digital Humanities“

ZUM PODCAST

Spannend? Dann unterstütze uns!

Sei der Erste der einen Kommentar abgibt

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.