Beyond the Leaks: Sind die investigativen Tools reif für den Newsroom?

Bei der diesjährigen Konferenz des Netzwerk Recherche beim NDR habe ich bei der Veranstaltung "Beyond the Leaks: Sind die investigativen Tools reif für den Newsroom?" einige neue integrierte Open Source Recherche-Tools der freien Suchmaschine Open Semantic Search zum Durchsuchen von Dokumentenbergen, Archiven und Leaks vorgestellt.

Dabei bin speziell darauf eingegangen, wieso für investigativen Journalismus trotz allen nützlichen und nötigen Automatisierung beim Textmining und quantitativen Recherche-Methoden manuelle Annotation und Tagging sowie selbstbestimmte Relevanzkriterien und Filter mittels qualitativem Thesaurus nötig sind.

Im Gegensatz zu oft am Ende der Recherche stehenden hübschen Datenvisualisierung im Datenjournalismus:

Die Daten wie z.B. OCR-Ergebnisse bei echten Recherchen sind oft dreckig, nicht nur vom Inhalt her.
Daher habe ich einige Methoden zur unscharfe Suche z.B. zum Umgang mit Rechtschreibfehlern, Tippfehlern oder unperfekten OCR Ergebnissen beim Umgang mit digitalisierten Akten eingegangen.

Der Vortrag "Beyond the Leaks: Sind die investigativen Tools reif für den Newsroom?" ist auf Youtube nachschaubar.