Loading...
Uncategorized

Wer ist die inkonsistenteste Tabelle im ganzen Land?

Beim letzten Datathon haben wir Gerichtsentscheidungen ausgewertet, die Zahlen sind in Kleinen Anfragen vergraben. Und dabei haben wir diese Juwele gehoben:

Das sind unsere Daten für 2017. Schauen wir die Struktur an. Die erste Spalte enthält die Herkunftsländer, und – „davon“. Originell. Minuszeichen scheinen Nullen darzustellen, und leere Zellen vermutlich auch. Worum es geht, steht darüber: Um Klagen.

Ein halbes Jahr später sehen dieselben Daten so aus:

Jetzt ist „Klagen“ eine Zelle der zweiten Zeile, neben einem Zeitraum. Die erste Spalte enthält also wahlweise Zeiträume oder Herkunftsländer, oder leere Zellen. Die zweite Spalte enthält neu die Anzahl Klagen. In der zweiten Zeile gibt es verbundene Zeilen, die ergeben meist Sinn, wenn man ihren Inhalt mit den Zellen darunter kombiniert – nun ist aber die erste Zelle darunter leer. Wir nehmen an, dass hier „gesamt“ gemeint ist. Neu sind auch die Zeilen mit den Prozenten, die enthalten Kommas und bringen unsere Umwandlung in CSV durcheinander. Das ist alles mühsam, aber reparabel, solange nur die Zahlen stimmen. Tun sie das?

Das können wir nicht wissen – außer redundante Angaben machen eine Prüfung möglich. Das tun hier die Prozente. Der Anteil sonstiger Verfahrenserledigungen errechnet sich als „sonst. Verfahrenserledigungen absolut“ / „Gerichtsentscheidungen gesamt“. In der letzten Zeile, Serbien, sind das 888 / 1215 = 73,1%. In der vorletzten Zeile, sind das 944 / 1215 = 77,7%. Und nicht 67,7%, wie es in der Tabelle steht. Was stimmt hier nicht? Es ist auffällig, dass die ersten 7 Zahlen dieser zwei Zeilen gleich sind.

Die Arbeit mit Daten ist mühselig. Bei der Übertragung schleichen sich Fehler ein. Da zieht jemand die Zahlen aus der Datenbank, überträgt sie in einen Editor, macht sie als PDF hübsch … Und wir müssen das alles wieder rückgängig machen, um an die Zahlen zu kommen. Warum nur, warum?

PS: Und wie war es vor 2017? Da wurden Klagen, Berufungen und Revisionen zusammengerechnet. In den jährlichen Berichten wurden 2013, 2014 und 2016 die Monate Januar bis November abgedeckt, im Jahr 2014 nur Januar bis Oktober.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.