Jetzt wird’s schmutzig: Datenschutz-Lecks in Google Analytics

14. Februar 2018 | Von in Google Analytics

Mit Google Analytics können wunderbar viele Daten im Handumdrehen erfasst werden. Dass der Datenschutz dabei eine wichtige Rolle spielt, ist allseits bekannt. In der konsequenten Durchsetzung des Datenschutzes hapert es aber leider noch bei vielen Website-Betreibern. Das kann teure Folgen haben.

Grundreinheit schaffen: Anonymisierung der IP-Adressen

Die anonymisierte Erfassung der Daten mit Google Analytics ist in Deutschland die wichtigste Basis für einen guten Datenschutz in der Webanalyse. Im Quellcode oder mit dem Google Tag Manager ist leicht einsehbar, ob das Analytics-Tag korrekt implementiert ist.

Das Beispiel zeigt die datenschutzkonforme Implementation des Analytics-Tags. Wichtig ist an dieser Stelle, dass die IP-Adresse anonymisiert wird, bevor der Seitenaufruf an Google Analytics weitergegeben wird.

Häufig sieht es nämlich leider wie im folgenden Beispiel aus. Die blanken Informationen des Seitenaufrufes werden an Google Analytics weitergegeben. Erst im Anschluss erfolgt die Anonymisierung der IP-Adresse. Nun ja, an dieser Stelle ist das Kind schon in den Brunnen gefallen.

Doch was passiert konkret dank „anonymizeIP, true“? Im Grunde genommen passiert nicht wirklich viel. Es wird lediglich das letzte Oktett der IP-Adresse abgeschnitten. Dadurch ist eine Rückverfolgung zu einer konkreten Person oder einem konkreten Zugriff nicht mehr möglich. In den Berichten von Google Analytics kann es leichte Auswirkungen, beispielsweise auf die geografischen Berichte, haben.

Tiefenreinigung: Erfasste Inhalte überprüfen

Die Datenschutz-Putzhandschuhe sollten an dieser Stelle noch nicht aus der Hand gelegt werden. Denn im nächsten Schritt geht es an die Tiefenreinigung. Objekt der Putz-Begierde sind in diesem Fall persönlich identifizierende Inhalte (kurz: PII). Das heißt: Sind Namen, Adressen, Telefonnummern oder E-Mail-Adressen in den Analytics-Berichten zu finden?

Namen gibt es viele, Adressen sind auch eher umständlich zu finden. E-Mail-Adressen enthalten jedoch alle ein gleiches Element: das @-Zeichen. Daher empfiehlt es sich, im Bericht zu allen Webseiten das @-Zeichen in das Suchfeld einzugeben.

Möglicherweise erscheinen dann nämlich, wie im obigen Beispiel, vollständig ausgeschriebene E-Mail-Adressen. Das ist aus Sicht des Datenschutzes äußerst kritisch und darf in dieser Form nicht an Google Analytics übergeben werden.

Ebenfalls kritisch sind persönlich identifizierende Inhalte an einer weiteren Stelle in Google Analytics, nämlich im Nutzer-Explorer. Dieser Bericht bietet extrahierte Informationen zu einzelnen Nutzern. Hier lässt sich die Customer Journey begleiten und beispielsweise erkennen, was direkt vor oder nach einer durchgeführten Conversion passiert. Da es sich in der Tat um einzelne, individuelle Nutzer handelt, ist hier eine Erkennbarkeit der Nutzer unbedingt zu vermeiden.

Dass in dem aufgeführten Screenshot so viel verpixelt dargestellt ist, zeigt, wie viele persönlich identifizierende Inhalte hier sonst zu sehen wären. Man wäre an dieser Stelle also in der Lage, Informationen zum Surf- und Kaufverhalten in Bezug auf eine einzelne Person zurückzuführen. Dank der E-Mail-Adresse könnte man die Person sogar anschreiben. Hier ist also ein sehr gründlicher Datenschutz-Frühlingsputz angebracht.

Gründe für das Großreinemachen

Die größte Motivation für eine saubere Weste im Datenschutz ist sicherlich eine lupenreine Datensicherheit für die Kundschaft sicherzustellen. Einerseits können neue Kunden davon abgeschreckt werden, wenn diese bemerken, dass ihre Daten bei der Website nicht sicher sind. Andererseits kann es Bestandskunden von einem Wiederkauf abhalten.

Außerdem kann es für die Website-Betreiber mit schlechtem Datenschutz in der Webanalyse teuer und ärgerlich werden. Teuer kann es werden, wenn Abmahnungen im Postfach landen. Es kann jeder Außenstehende mit drei Klicks überprüfen, ob eine IP-Adressen-Anonymisierung für Google Analytics erfolgt.

Ärgerlich kann es darüber hinaus noch werden, wenn Google die Erfassung persönlich identifizierender Inhalte registriert. Im schlimmsten Fall kommt es zur Löschung aller bisher mit Google Analytics erfassten Daten. Das kann insbesondere dann ärgerlich sein, wenn schon zahlreiche Individualisierungen vorgenommen worden sind. Zeitvergleichende Analysen sind dann zunächst unmöglich.

Fazit

Es ist Zeit für einen gründlichen Frühjahrsputz im Webanalyse-Datenschutz. Zwei übergreifende Fragen sollten sich Website-Betreiber stellen:

  • Werden die erfassten Daten anonymisiert an Google Analytics übergeben?
  • Befinden sich persönlich identifizierende Inhalte in den Google-Analytics-Berichten?

Wenn sich hier „schmutzige Ecken“ finden lassen, besteht dringender Putz- und Handlungsbedarf.

Unser nächstes Webinar am 08. Juni 2018:
Duplicate Content: Der perfekte SEO-Werkzeuggürtel gegen doppelte Inhalte

Viele Unternehmen haben Angst vor Duplicate Content und fürchten negative Effekte, wenn Inhalte gedoppelt vorkommen – bis hin zu Abstrafungen. Auch wenn diese Ängste in der Regel nicht gerechtfertigt sind, müssen sich Website-Betreiber doch mit dem Thema beschäftigen, um negative Auswirkungen zu verhindern. Mit mächtigen Werkzeugen, wie der Google Search Console und dem Canonical Tag, geht es den doppelten Inhalten ganz einfach an den Kragen!

Jetzt kostenlos anmelden:
Duplicate Content: Der perfekte SEO-Werkzeuggürtel gegen doppelte Inhalte 

Alle kommenden Webinare:
Bloofusion- und suchradar-Webinare im Überblick

The following two tabs change content below.

Helen Ramm

Helen Ramm ist Teamleiterin des SEA-Teams in der Online-Marketing-Agentur Bloofusion. Ihr Steckenpferd ist außerdem die Datenanalyse mit Google Analytics.

Helen Ramm ist unter anderem in den folgenden sozialen Netzwerken zu finden: