Das ging ja schnell. Eine Empörungswelle im Netz und schon verkündet das Hasso-Plattner-Institut, dass das Forschungsprojekt mit der Schufa gekündigt wurde:
Den mit der SCHUFA Holding AG bestehenden Vertrag über eine Zusammenarbeit bei der Grundlagenforschung rund um technische Verarbeitung öffentlicher Web-Daten hat das Hasso-Plattner-Institut (HPI) heute gekündigt. Angesichts mancher Missverständnisse in der Öffentlichkeit über den vereinbarten Forschungsansatz und darauf aufbauender Reaktionen könne ein solches wissenschaftliches Projekt nicht unbelastet und mit der nötigen Ruhe durchgeführt werden, erklärte HPI-Direktor Christoph Meinel.
Gestern gab es anscheinend auch schon eine Pressemitteilung (Achtung: PDF!), die versucht hat, klarzustellen, was genau das Forschungsprojekt eigentlich umfasst:
Es geht bei dem Drittmittelprojekt schlicht um Forschung, die eine fundierte und belastbare Grundlage für eine abgewogene Bewertung dessen liefern kann, welche WebDaten überhaupt verwertbar und welche Informationen generierbar sein könnten im Netz – dies ausdrücklich und vor allem auch unter dem Aspekt von gesellschaftlichen Risiken.
Nur ein kleiner Teil der Ideen in der zitierten Liste bezieht sich überhaupt auf ausdrücklich personenbezogene Daten, der viel größere auf ganz allgemeine Daten, zum Beispiel Bevölkerungsdaten, aus dem Internet. Das HPI hat den Journalisten gegenüber betont, dass es selbstverständlich weder geplant noch vertraglich vereinbart ist, personenbezogene Daten, die im Rahmen der Forschungstätigkeit des HPI entstehen, der Schufa zur Verfügung zu stellen.
Leider wird daraus immer noch nicht klar, was genau sie denn untersuchen wollen. Angeblich gab es weiterführende Informationen per Pressemitteilung und auf den Homepages, jedoch konnte ich diese nicht finden. Ein bisschen mehr Social Media-Kompetenz täte dem Institut also gut, vor allem, wenn man genau das untersuchen will.
Weiter unten wird es dann aber zumindest ein bisschen klarer:
Zum Hintergrund: Es geht nicht etwa um das Ausspionieren von Geheimdaten, sondern um das Auffinden öffentlicher Informationen, die im Netz stehen, weil sie jemand dort bewusst hinein und damit zur Verfügung gestellt hat. Die meisten dieser Daten sind für jeden Internetnutzer durch ganz normale Suchmaschinen-Abfragen manuell recherchierbar. Das HPI untersucht lediglich die automatisierte Suche – sowohl an der Oberfläche als auch in der Tiefe des Web. Suchmaschinen und ihre Webcrawler werden ja ständig weiterentwickelt, so dass Internetseiten, die in der Vergangenheit noch zum so genannten Deep Web gehörten, längst schon Teil des „Oberflächenwebs“ sind. Ignoriert wird von den beiden Journalisten schlichtweg, dass etwa Daten im Deep Web zwar für die meisten unsichtbar, aber doch recherchierbar sind. Berücksichtigt wird auch das so genannte „dark web“, also Daten, die für angemeldete Internetnutzer offen sichtbar sind.
Mir ist nun leider unbekannt, was denn das „Oberflächenweb“ und das „Deep Web“ sein sollen und auch ist unklar, ob mit „dark web“ nicht doch Freundesdaten gemeint sind. Denn „öffentlich“ gibt es ja gar nicht, es gibt immer nur einen angenommenen und tatsächlichen Kontext. Und genau darum geht es ja bei diesem „Skandal“. Der User hat beim Veröffentlich ja eben nicht daran gedacht, dass es mal von der SCHUFA ausgelesen werden könnte. Und er weiss dann auch immer noch nicht, was die SCHUFA damit machen würde. Insofern hört sich dieser Absatz doch eher so an, als würde er den Kritikern recht geben. Er zeigt zudem, dass das HPI die Problematik noch nicht einmal reflektiert zu haben scheint.
Hier würde ich mir mehr Informationen wünschen, auch wenn das Projekt jetzt abgeblasen ist, was ich im übrigen auch schade finde, denn mehr Forschung in dem Bereich wäre nicht schlecht.
Vielleicht kann man das ja noch einmal überdenken, es an eine unabhängigeren Auftraggeber koppeln und dann vor allem auch hier viel transparenter kommunizieren.