[GA4] Der richtige Umgang mit Bot-Traffic

6. September 2023 | Von in Google Analytics

Bot-Traffic kann eine ziemlich nervige Sache sein, weil es uns die Berichte in Analytics verwässert. Aber was ist eigentlich Bot-Traffic? Wo kommt er her? Wie finde ich ihn und was kann ich dagegen tun?

Was ist Bot Traffic?

Bots sind automatisierte Programme, die im Internet agieren. Sie können aus vielen Gründen eingesetzt werden, von legitimen wie Suchmaschinen-Crawling bis hin zu weniger legitimen wie dem Scraping von Inhalten oder dem Versuch, Sicherheitslücken zu finden. Egal aus welchem Grund, Bots generieren Traffic auf deiner Website, und dieser Traffic kann in Google Analytics erfasst werden.

Warum ist Bot-Traffic ein Problem?

Es gibt mehrere Gründe, warum Bot-Traffic problematisch sein kann:

  1. Verzerrung von Daten: Wenn ein großer Teil deines Traffics von Bots stammt, kann dies deine Daten verzerren und es schwierig machen, echte Trends oder Verhaltensweisen deiner Nutzer zu erkennen.
  2. Ressourcenverbrauch: Bots können Server-Ressourcen verbrauchen und die Leistung deiner Website beeinträchtigen, insbesondere wenn sie in großer Zahl auftreten.
  3. Sicherheitsbedenken: Einige Bots sind bösartig und versuchen, Sicherheitslücken auf deiner Website zu finden oder Spam zu versenden.

Schließt GA4 Bot-Traffic aus?

Klares Jein! Es gibt selbstverständlich Instrumente in GA4, die manchen Bot-Traffic einfach herausfiltern. So beschreibt es Google zumindest auf seinen Supportseiten. Das heißt jedoch leider nicht, dass jeder Bot-Traffic automatisch erkannt wird, sodass Berichte vereinzelt Bot-Traffic enthalten könnten.

Wie identifiziere ich Bot-Traffic in Google Analytics?

In der Regel lässt sich Bot-Traffic anhand wiederkehrender Merkmale erkennen:

Beispiel 1: Gleiche Kalendertage

In diesem Beispiel kehrt der Bot immer am selben Tag eines Monats zurück und wir erkennen Ausschläge bei den Nutzern.

Beispiel 2: Bildschirm-Auflösung
Häufig verwenden Bots eine eher ungewöhnliche, nicht mehr häufig verwendete Bildschirmauflösung, wie z. B. 400×400 oder 800×600.

Beispiel 3: Veraltete Browser-Versionen
Auch veraltete Browser-Versionen können ein Hinweis auf Bot-Traffic sein. Während echte Nutzer dazu neigen, ihre Browser aufgrund von Sicherheitsbedenken, neuen Funktionen oder verbesserten Performance-Updates zu aktualisieren, tun Bots dies nicht notwendigerweise. Menschen aktualisieren ihre Browser im Laufe der Zeit, entweder manuell oder automatisch. Wenn jedoch über längere Zeiträume hinweg Traffic von der exakt gleichen veralteten Browserversion generiert wird, könnte das ein Zeichen für Bot-Aktivitäten sein.

Beispiel 4: Verweisquellen
Einige Bots hinterlassen eine spezifische Referral-URL, die du in den Berichten identifizieren kannst.

Beispiel 5: Unnatürlich hohe Bounce-Raten

Wenn ihr eine ungewöhnlich hohe Anzahl von Besuchen mit einer 100%igen Absprungrate seht, könnte dies auf Bots hindeuten.

Beispiel 6: Kurze durchschnittliche Sitzungsdauer

Bots verbringen in der Regel sehr wenig Zeit auf einer Webseite.

Beispiel 7: Ungewöhnliche Länderzugriffe

Zugriffe aus einem Land, aus dem deine Nutzer gewöhnlich nicht auf deiner Seite surfen.

Beispiel 8: Geringe Interaktionen

Außerdem sind die Metriken „Sitzungen mit Interaktionen“, „Interaktionsrate“ etc. i. d. R. gleich Null, da Bots nicht mit der Seite interagieren können.

Wichtig: Um sicher zu gehen, dass es sich wirklich um Bot-Traffic handelt, solltet ihr Auffälligkeiten unbedingt tiefergehend analysieren. In der Regel sollten mehrere der oben genannten Beispiele gleichzeitig zutreffen.

Übrigens: Bei unseren GA4-Audits führen wir bei der Überprüfung der Datenqualität auch Bot-Checks durch.

Mehr zum GA4-Audit erfahren

Wie analysiere ich trotz Bot-Traffic?

Segmentierung: Über das Einrichten von Vergleichen und Segmenten kannst du Zugriffe mit gewissen Merkmalen von der Analyse ausschließen. So kannst du den Traffic von echten Menschen und den von Bots unterscheiden und separat analysieren.

Wie kann ich Bot-Traffic vermeiden?

Kommen wir jetzt zur letzten spannenden Frage: Wie kann ich Bot-Traffic zukünftig vermeiden? Aktuell (Stand 16.08.2023) können in GA4 noch keine Filter verwendet werden, um den Traffic einfach auszuschließen. Dennoch gibt es einige Möglichkeiten.

Wichtig: Ihr solltet euch absolut sicher sein, welchen Traffic ihr ausschließt.

Möglichkeit 1: Server-side-Tagging (SST-Tagging)

Kurzer Exkurs: Beim Server-side-Tagging schickst du deine gesammelten Daten nicht direkt an deine Google Analytics 4 Property, sondern zunächst an einen eigenen Tagging-Server. Dort kannst du die Daten anpassen und erst dann werden diese weitergeschickt.

Zunächst einmal kann die eigene Stream-ID im Server-side-Tagging verdeckt werden. Das macht es Crawlern schwerer, deine wahre Stream-ID herauszufinden. Die Stream-ID wird genutzt, um den Bot-Traffic gezielt in deine Property zu bekommen. Das Verstecken der eigenen Stream-ID ist beim Server-side-Tagging Best Practice.

Außerdem können die Trigger im Google Tag Manager, über die definiert wird, wann Tracking Tags auslösen sollen, so angepasst werden, dass bei einer bestimmten Kombination von Variablen die Daten nicht an GA4 weitergereicht werden. Haben wir also herausgefunden, dass bestimmte Referrer Spam produzieren, können wir diesen auf unseren Server filtern.
So kommen die Daten erst gar nicht bei Google Analytics 4 an, sondern werden schon auf dem Server herausgefiltert.

Möglichkeit 2: Rate Limiting
Mit dieser Technik kann die Anzahl der Anfragen, die von einer bestimmten IP-Adresse in einem bestimmten Zeitraum gemacht werden, begrenzt werden. Dies kann helfen, Bots zu verlangsamen oder zu blockieren, die versuchen, eine Website mit Anfragen zu überfluten. Die Durchsatzbegrenzung wird dabei nicht auf einem Webserver selbst durchgeführt, sondern in entsprechenden Anwendungen.

Möglichkeit 3: Blacklisting
Wenn bestimmte IP-Adressen oder User-Agents bekannt sind, die schädlichen Bot-Traffic generieren, können sie auf eine Schwarze Liste gesetzt und vom Zugriff auf die Website ausgeschlossen werden. Das lässt sich in der Regel über den Hosting-Anbieter regeln.

Möglichkeit 4: Content Delivery Networks (CDNs)
Einige CDNs bieten integrierte Sicherheitsfunktionen, um Websites vor bösartigem Bot-Traffic zu schützen. Das CDN ist ein Netzwerk von Servern, das die Inhalte von deinem Server (Ursprungsserver) verteilt.

Fazit
Während einige Bots nützlich und sogar notwendig für den ordnungsgemäßen Betrieb des Internets sind, können andere schädlich sein und negative Auswirkungen auf Websites und ihre Nutzer haben. Es ist wichtig, sich der verschiedenen Arten von Bots und ihrer potenziellen Auswirkungen bewusst zu sein und geeignete Maßnahmen zu ergreifen, um unerwünschten oder schädlichen Bot-Traffic zu erkennen und zu blockieren.

The following two tabs change content below.
Avatar-Foto

Andreas Engelhardt

Andreas Engelhardt ist Head of Digital Analytics + CRO bei der Online-Marketing-Agentur Bloofusion.

Dort berät er Kunden bei der Webanalyse und der Optimierung ihrer Seiten für mehr Sales und Leads. Zudem bloggt er regelmäßig im Bloofusion Blog.

Andreas Engelhardt ist unter anderem in den folgenden sozialen Netzwerken zu finden:

Kommentieren