Zum Inhalt springen

#1 Notizen: Markus Schnöpf (BBAW) –
Über Entwicklungen der Digital Humanities

Im Februar 2018 startete unser Podcast. Markus Schnöpf, wissenschaftlicher Mitarbeiter an der Berlin-Brandenburgischen Akademie der Wissenschaften, ließ sich von uns mit Fragen durchlöchern. Was herauskam, könnte ihr in unserem Podcast nachhören:

Für alle, die keine Zeit zum Zuhören haben oder sich einfach einen Überblick über das Gespräch wünschen, haben wir hier die wichtigsten Thesen und Hintergrundinfos zusammengetragen.


Thesen Thesen | Hintergrundinfos Hintergrundinfos | Tipps Tipps für Studenten


Thesen

  • Der größte Teil an Informationen liegt noch immer analog vor. Daher ist auch ein Digital-Wissenschaftler auf viel „Handarbeit“ angewiesen. So umfassen beispielsweise die Akademiebestände der BBAW fast sechs laufende Kilometer. Digitalisiert wurden in den vergangenen 20 Jahren jedoch nur sechs Meter.
  • Mit der Digitalisierung von Kommunikation wird die Quellenlage unübersichtlich und mit traditionellen (manuellen) Methoden undurchdringbar. Komplexe Forschungsdaten können nicht mehr manuell durchdrungen werden, sondern die Wissenschaft ist auf computergestützte Methoden angewiesen. Beispielsweise liegt die Kommunikation der USA mit den Botschaften seit den 70er Jahren digital vor.
  • Wir sind auf die Strukturierung durch Algorithmen bzw. eine Künstlichen Intelligenz angewiesen. Die Entwicklung geht vom „Close Reading“ zum „Distant Reading“.
  • Einzelne Leuchtturmprojekte müssen verbunden werden. Den Forschenden müssen befähigt werden, unter den Creative-Commons-Lizenzen Projekte aufeinander aufzubauen und weiterzuführen – um relevante Daten aus anderen Projekten extrahieren, ordnen und neu analysieren zu können.
  • Google liefert uns Treffer, jedoch keine Antwort auf die Frage, was wahr ist. Der kritische Umgang mit Suchmaschinen sollte daher bereits im Schulunterricht gelehrt werden.
  • Wir brauchen eine „digitale Ethik“ und Verhaltensregeln: Um „Fake News“, Fälschungen und die Verletzung von Persönlichkeitsrechten zu vermeiden, müssen Informationsquellen kenntlich gemacht und Entwicklungen im Bereich der Künstlichen Intelligenz hinterfragt werden.
  • Algorithmen sind zunächst einmal eine „Black Box“. Nur, wer die Funktionsweise und Provenienz eines Algorithmus versteht, kann auch gesicherte Aussagen über entsprechende Analyseergebnisse dieses Algorithmus treffen. Das gilt insbesondere für Wissenschaftler, die mit KIs arbeiten.
  • Auch in den Schulen muss Medienkompetenz gestärkt werden, denn jeder Algorithmus interpretiert. Die Vermittlung von Programmierkenntnissen sollte zunehmend in die Lehrpläne aufgenommen werden.
  • Die digitalen Wissenschaften sind oftmals noch nicht in den Institutionen – und damit in den Stellenplänen und in den Curricula – angekommen. Besonders im geisteswissenschaftlichen Bereich sind digitale Methoden noch zu jung. Daher ist es für diesbezüglich interessierte Studierende besonders wichtig, sich Zusatzqualifikationen anzueignen.
  • Wir brauchen eine mediale Öffnung des wissenschaftlichen Systems: Verschiedene Medien und Formate müssten als Forschungsleistungen akzeptiert werden, denn sie bieten ein breites Spektrum an Möglichkeiten. So kann beispielsweise eine Webseite, die aus einer Forschungsarbeit hervorging, noch immer nicht bewertet werden. Akzeptiert wird meist nur Gedrucktes und ggf. PDFs.
  • Wir leben im „digitalen Inkunablenzeitalter“: Unser Publikationssystem orientiert sich stark an der gedruckten Form, das gedruckte Buch wird imitiert. Das Ziel ist jedoch, sich davon zu lösen und neue Möglichkeiten auszuschöpfen.
  • Eine gemeinsame Kommunikationsbasis zwischen den Disziplinen ist oftmals schwierig herzustellen, jedoch für beide Seiten fruchtbar. Besonders schwierig ist der Austausch zwischen Geistes- und Naturwissenschaftlern. Ein stärkerer Dialog ist hier unbedingt wünschenswert, gerade hinsichtlich des disziplinübergreifenden Einsatzes möglicher digitaler Werkzeuge.

Hintergrundinfos

 

Markus Schnöpf

… ist Historiker und wissenschaftlicher Mitarbeiter an der Berlin-Brandenburgischen Akademie der Wissenschaften im Projekt TELOTA (The Electronic Life Of The Academy). Er scannte bereits vor fast 20 Jahren die Keilschriftsammlung der Eremitage in St. Petersburg. Heute ist er Lehrbeauftragter im Masterstudiengang Editionswissenschaften an der Freien Universität Berlin und betreut an der Akademie der Wissenschaften unter anderen das Corpus Coranicum, eine digitale historisch-kritische Ausgabe des Korans. Außerdem hat er das interdisziplinäre Seminar „Digital Classicists“ in Berlin ins Leben gerufen.

Wer Markus persönlich kennenlernen möchte, kann ihn jeden letzten Freitag des Monats im Berliner Deckshaus treffen, wo er den Digital-Humanities-Stammtisch organisiert.

Infos zu Markus Schnöpf

Berlin-Brandenburgische Akademie der Wissenschaften

Die Berlin-Brandenburgische Akademie der Wissenschaften gehört zu den acht Institutionen, die in der Union der deutschen Akademien der Wissenschaften zusammengeschlossen sind. 2018 wurde hier die interdisziplinäre Arbeitsgruppe „Verantwortung im digitalen Zeitalter“ ins Leben gerufen. Diese beschäftigt sich mit den gegenwärtigen Entwicklungen der Künstlichen Intelligenz und Formen der Automatisierung – und diskutiert ethische sowie juristische Fragestellungen.

Infos zur BBAW

Historische Demographie

In Deutschland bildete sich in den 80ern eine Computer-Skepsis heraus. Damals wurden dazu historische Kirchenbücher ausgewertet, um eine Volkszählung durchzuführen (Historische Demographie). Viele Personen aus Westdeutschland waren damals gegen die massenhafte, computergestützte Verarbeitung personenbezogener Daten. Heute geben wir sogar unsere biometrischen Informationen weiter …

Infos zum Volkszählungsurteil

CDLI – Cuneiform Digital Library Initiative

Es handelt sich um ein gemeinsames Projekt der University of California, Los Angeles, der University of Oxford und des Max-Planck-Instituts für Wissenschaftsgeschichte, Berlin. Hier werden historische Keilschriften digitalisiert, vervolltextet und mit Metadaten angereichert. Nachdem Markus die Keilschriftsammlung des Vorderasiatischen Museums Berlin digitalisiert hatte, war er im Jahr 2000 in Sankt Petersburg und scannte die Keilschriftsammlung der Eremitage. Wichtig: Es genügt nicht, die Schriftseite einer Keilschrifttafel zu erfassen, sondern auch die Rück- und Seitenansichten müssen digitalisiert werden. Auch hier können sich wertvolle Informationen befinden. Ein Scan umfasst pro Keilschrift also sechs Ansichten.

Infos zur CDLI

Perseus Digital Library

Die Perseus Digital Library ist ein Leuchtturmprojekt, das bereits in den 1980ern startete. Zudem stellte der Thesaurus Linguae Graecae Altertumswissenschaftlern bereits sehr früh klassische Texte digital zur Verfügung – erst auf Diskette, dann auf CD und heute online. Aufgrund dieser Sprachtechnologien können auch Studenten, die des Altgriechischen nicht mächtig sind, auf entsprechende Texte zugreifen und sie im Original lesen zu können.

Infos zur Perseus Digital Library

Infos zum Thesaurus Linguae Graecae

Plagiat

Ein Plagiat ist die unerlaubte Verwendung fremden geistigen Eigentums, ohne eine solche Nachnutzung entsprechend zu kennzeichnen. Auch die mangelnde Kenntlichmachung von Texten aus der frei zugänglichen Wikipedia ist beispielsweise ein Rechtsverstoß. Ebensowenig dürfen urheberrechtlich geschützte Materialien gepostet werden. So plant die EU entsprechende automatisierte Filter, um den Upload urheberrechtlich geschützter Materialien zu verhindern. Die Creative-Commons-Lizenzen begegnen diesem Urheberrechtsproblem. Mit diesen können Forscher selbst entscheiden, inwiefern ihre Forschungsdaten und -ergebnisse weiterverwendet und kenntlich gemacht werden sollen.

Infos zur EU-Verordnung

Infos zu den Creative-Commons-Lizenzen

Künstliche Intelligenz (KI / engl. AI)

Eine künstliche Intelligenz bezeichnet einen Algorithmus, der selbstständig lernfähig ist. Normalerweise werden Programme trainiert, um bestimmte Ergebnisse zu erzielen. Beispielsweise trainieren Forscher Algorithmen auf eine ganz bestimmte Handschrift – jeden einzelnen Buchstaben – und mit der Zeit erkennt der Computer diesen Buchstaben wieder und kann auch einen neuen Text mit demselben Schrifttyp entziffern. Eine Künstliche Intelligenz hingegen lernt selbstständig. Der Algorithmus erschließt sich Strukturen, durch Trial-and-Error, und wird so selbstständig schlauer. Trainiert wird er dabei zunächst anhand von bekannten Datensätzen/-mustern.

Im alltagssprachlichen Gebrauch wird jedoch oft auch ein ganz „normaler“ (unselbstständig lernender) Algorithmus als KI bezeichnet. Gerade Programme, die massenhaft Daten auswerten können, sind dem Menschen zumindest in diesem Punkt tatsächlich überlegen … ob sie jedoch intelligent sind, kann bezweifelt werden.

Infos zur Künstlichen Intelligenz (KI)

Python

Python ist eine Programmiersprache, angelehnt an Monty Python. Hierzu gibt es zahlreiche Tutorials und eine sehr umfangreiche Standardbibliothek vorgefertigter Codes. Sie ist relativ leicht zu lernen und gut strukturiert.

Infos zu Python 

Digitale Langzeitarchivierung

Wir leben in einem dunklen Zeitalter. So verschwindet beispielsweise unsere E-Mail-Kommunikation und wird in den meisten Fällen nicht archiviert – Informationen aus Kultur, Politik und Forschung gehen für immer verloren, wenngleich wir noch heute Korrespondenzen aus vergangenen Jahrhunderten einsehen können. Dennoch kann man sagen: Auch in der Geschichte hatten wir mit einem massiven Informationsverlust zu kämpfen, da nur sehr wenige Schriftstücke, Werke, Briefe etc. aufbewahrt wurden und viel vermeintlich Unwichtiges verschwand oder vergessen wurde.

Umso wichtiger ist es, für eine langfristige Verfügbarkeit digitaler Informationen wie Korrespondenzen, Datenbanken und ganzer Webseiten zu sorgen – und in Projekten entsprechende zusätzliche Mittel einzuplanen. Denn mit jedem Update und mit jedem Tag gehen Informationen verloren oder werden nicht mehr abrufbar. Die Forschung zur digitalen Langzeitarchivierung beschäftigt sich genau mit diesem Thema.

Infos zur digitalen Langzeitarchivierung

N-Grams

Mit N-Grams lassen sich große Textmengen statistisch durchsuchen, indem sie in einzelne Fragmente zerlegt werden. So erhält der Wissenschaftler beispielsweise die Verteilung eines bestimmten Begriffs über Tausende Texte hinweg. Hierdurch lassen sich kulturelle Tendenzen innerhalb einer oder mehrerer Epochen ausmachen.

Infos zu Google Books Ngram Viewer

(Soziale) Netzwerkanalyse

Die ursprünglich aus der Soziologie stammende Soziale Netzwerkanalyse ist eine in den digitalen Geisteswissenschaften sehr verbreitete Methode, um soziale Verbindungen, ob fiktiv oder reale, zu durchleuchten. Gelehrtennetzwerke, politische Verbindungen, Figurenkonstellationen – all das kann mithilfe netzwerkanalytischer Methoden strukturiert und analysiert werden.

Für die letztendliche Präsentation großer Datenmengen eignen sich in einem zweiten Schritt Visualisierungstools wie Gephi, die Knotenpunkte – also beispielsweise Personen oder auch Orte – nach bestimmten Parametern ordnen können. Entitäten mit großem Einfluss und vielen Verbindungen zu anderen Entitäten erhalten so eine zentrale Stellung im Netzwerk und können in einer entsprechenden Visualisierung auf einen Blick ausfindig gemacht werden. Geeignet sind derartige Werkzeuge vor allem für die Wissensvermittlung und Ergebnispräsentation.

Wie eine solche Visualisierung letztendlich aussehen kann, zeigt Martin Grandjean exemplarisch an den Figurennetzwerken der Bühnenstücke Shakespeares.

Infos zu Shakespeare-Netzwerken

Infos zur Sozialen Netzwerkanalyse in der Literaturwissenschaft

Infos zum Visualisierungstool Gephi

Digital Classicists Berlin

Die Digital Classicists Berlin sind ein seit 2012 bestehender institutionsübergreifender Zusammenschluss von Forschenden und NachwuchswissenschaftlerInnen, die sich für digitale Methoden interessieren. Die ursprüngliche Vereinigung gründete sich im King’s College London, die von dem Epigrafiker Gabriel Bodard ins Leben gerufen wurde. Das Berliner Seminar wurde von Matteo Romanello gegründet. Der Schwerpunkt liegt auf dem Einsatz digitaler quantitativer Methoden in den Altertumswissenschaften. Gerade in dieser Disziplin wird sehr intensiv mit digitalen Werkzeugen gearbeitet: seien es die dreidimensionale Erfassung von historischen Bauwerken oder Inschriften oder auch die netzwerkanalytische Erforschung von Korrespondenzen aus der römischen Antike.

Die Digital Classicists treffen sich im Wintersemester zweimal pro Monat zu einem wissenschaftlichen Vortrag mit Diskussion und anschließendem und anschließendem Umtrunk. Über kommende Veranstaltungen könnt ihr euch auf der Homepage des Seminars informieren. Dort sind auch vergangene Vorträge als Videos abrufbar.

Infos zu den Digital Classicists

Tipps für Studierende

  • Zusatzqualifikationen lohnen sich, beispielsweise grundlegende Programmiertechniken in einer Sprache wie Python – auch wenn das nicht unbedingt in den Curricula verankert ist. Für Historiker gibt es das spezielle Angebot „Programming Historian„. Hier sind zahlreiche Webinare verfügbar, um Netzwerkanalysen, Georeferenzierungen, Sentimentanalysen etc. zu erlernen.
  • Die Fähigkeit, eine eigene Webseite oder einen Wissenschaftsblog zu basteln, ist ebenso hilfreich. Wie das geht, erfahrt ihr hier.
  • Auch Konferenzen aus dem geisteswissenschaftlichen Bereich bieten mittlerweile sogenannte „Postersessions“ an. Hier können Forschungsprojekte kurz und bündig präsentiert werden, neiust durch einen „Posterslam“ begleitet. Falls ihr also ein Forschungsprojekt oder Zwischenergebnisse präsentieren möchtet, empfehlen wir euch die DHd2019, die Jahreskonferenz der Digital Humanities im deutschsprachigen Raum. Wie ihr das perfekte Poster für euer Projekt gestaltet? Hier könnt ihr euch Anregungen holen.
  • Codet nicht blind drauflos, sondern behaltet auch die traditionellen Methoden im Auge. Denn Algorithmen können uns zwar die Arbeit erleichtern, aber nicht abnehmen. Fragt euch zuerst, was euch eine Methode tatsächlich bringt – und ob ihr damit euer Ziel erreichen könnt. Und vielleicht hat jemand anderes einen ähnlichen Weg beschritten, von dessen Herangehensweise ihr euch inspirieren lassen könnt.
Spannend? Dann unterstütze uns!

Sei der Erste der einen Kommentar abgibt

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.