Soft 404: Was ist das? Kann mir das schaden? [Alles auf Start 66]

28. Juli 2022 | Von in Search Camp + Alles auf Start, SEO

In der Google Search Console kann man im Report „Abdeckung“ über etwas stolpern, das nicht jeder sofort versteht: Soft 404. Was ist das? In welchen Situationen können diese Fehler auftreten? Und noch wichtiger: Was kannst Du dagegen unternehmen?

 

Keine Ausgabe unserer Podcasts mehr verpassen?
Dann melde Dich jetzt mit Deiner E-Mail-Adresse für unseren wöchentlichen SEO-Alert-Newsletter an:

Mit der Registrierung erklären Sie Ihr Einverständnis zum Erhalt der Update mit Revue sowie zur Analyse der Öffnungs- und Klickraten. Zu Ihrer Sicherheit erhalten Sie vorab eine Mail einem Bestätigungs-Link (Double-Opt-In). Sie können sich jederzeit mit dem Abmeldelink in einer Mail vom Newsletter abmelden.

 

Die wichtigsten Podcast-Links:

 

Shownotes

 

Soft 404: Was ist das? Kann mir das schaden?

Auch heute gibt es wieder ein Thema, was ihr an mich herangetragen habt, wofür ich immer sehr dankbar bin. Also bitte macht das weiterhin, nämlich das Thema Soft 404. Auch da hatte ich letztens zweimal eine Nachfrage. Und ja, wenn man sich zum Beispiel mit der Google Search Console beschäftigt, dann kommt das irgendwann mal vielleicht. Und dann steht da Soft 404 und sehr viele tun sich damit sehr schwer. Und deswegen möchte ich dir erst mal heute erklären, was das ist. Das zweite natürlich, ja, wie du finden kannst, ob du damit ein Problem hast.

 

2xx vs. 4xx

Fangen wir mal ganz vorne an. Für – ich versuche es mal, für Nicht-Techniker zu erklären. So. Google crawlt ja deine Website. Nicht nur deine, sondern auch ganz viele andere, und fragt verschiedene Seiten an und wenn das passiert, schickt es quasi eine URL hin und der Server sagt, “Habe ich.” oder “Habe ich nicht.” Ich kann auch irgendeine kryptische URL eingeben, ich denke mir einfach mal eine aus, und dann sagt er natürlich, “Habe ich nicht.”

Je nachdem, ob er das hat oder nicht, wird der Server einen Status Code zurückliefern. Bei 200 ist alles okay, bei 404, das haben wir auch schon oft gehört, heißt es eben, “Habe ich nicht.” Es gibt auch noch 410, aber da sollten wir jetzt nicht in die Tiefe gehen. Grundsätzlich gilt einfach nur, 200 heißt, “Das Ding habe ich.” Und wenn etwas 200 liefert, dann kann es eben auch im Index landen. Sonst nicht. Das ist das Wichtige.

 

Was liefert der Server?

Und die meisten Server machen genau das. Nämlich, wenn es eine Seite gibt, liefern die 200 zurück. Ja, und manchmal, manche Server können das eben einfach nicht. Also, was passiert dann? Und genau das ist das Soft 404. Das heißt, der Server liefert einen Code 200 zurück. Also die Seite gibt es. Google schaut sich diese Seite dann an und glaubt aber, dass es eigentlich ein 404-Code sein müsste. Und das passiert eben manchmal.

Dann ist so ein Server einfach falsch konfiguriert. Dann leitet der Server zum Beispiel um, wenn es eine URL nicht gibt, auf die Startseite. Also eine 301 Umleitung auf die Startseite und die liefert einen Code 200. Google erkennt aber, ja, das ist ja nicht das, was ich wollte. Ich wollte ja was ganz anderes haben. Und deswegen, das ist dann ein Soft 404. Das heißt, nochmal, der Server liefert einen Code 200 zurück, sagt, “Diese Seite ist okay.” Google denkt aber, “Eigentlich hättest du mir einen Code 404 zurückliefern müssen.” Und dann passiert eben genau das. Das heißt, Google impliziert dann diesen 404 und schmeißt die Seite aus dem Index raus. Das heißt noch mal, der Server hat gesagt, “Habe ich, diese Seite.” und Google schmeißt sie dann trotzdem raus.

 

Ist mein Server falsch konfiguriert?

So. Interessiert euch das? Also erst mal ist es geiles Partywissen, keine Frage. Aber auf der anderen Seite sollte man das natürlich wirklich mal testen. Man kann das relativ leicht testen, nämlich indem du dir einfach mal eine URL ausdenkst, also zum Beispiel www.deinewebsite.de/ – Slash – und dann hämmerst du mal ein bisschen auf die Tasten rein. KJSDFLKJSZ34105, irgendeine URL, die es nicht gibt. Und diese URL, die es nicht gibt, die gibst du jetzt mal in das Tool httpstatus.io ein. Das ist ein sehr geniales Online Tool. Jeder SEO kennt das glaube ich irgendwie.

Da gibst du eine URL ein und dann sagt er dir halt, welcher Status Code wird zurückgeliefert von einem Server. Und natürlich, wenn du so eine nicht existente URL eingibst, muss 404 zurückkommen. Und manchmal, relativ selten, gibt es eben Fälle, wo das nicht funktioniert. Dann ist der Server falsch konfiguriert, dann kommt eben was anderes dabei raus und dann musst du deinen Server erst mal reparieren.

 

Es gibt noch mehr Fälle …

Das war aber der einfache Fall. Jetzt gibt es noch zwei Fälle.

Der eine Fall ist der: Du hast einen Onlineshop und du hast eine Produktdetailseite, das Produkt selbst ist aber nicht mehr lieferbar. Dann sagt Google auch, “Ja, sorry -” – oder kann Google sagen, so ist es richtiger, “Ja, das haben wir jetzt verstanden. Das heißt, eigentlich gibt es das Produkt ja nicht, der Nutzer kann es nicht kaufen.” Und dann werden solche Produktdetailseiten auch mal gerne “gesoft-404-t”, also aus dem Index entfernt, obwohl es sie eigentlich noch gibt. Und da muss man natürlich bei so einem, wenn man so einen Shop hat, sehr genau hingucken, was steht da auf der Seite? Und wenn ich zum Beispiel weiß, dass so ein Produkt vielleicht einen Tag nicht lieferbar ist, dann ist es vielleicht manchmal gut, das einfach nicht auf die Seite drauf zu schreiben, damit Google eben diese Produktdetailseite gar nicht erst entfernen kann. Ist ein relativ spezieller Fall. Passiert relativ selten, deswegen kann man das fast liegen lassen.

Es gab aber gerade im letzten Sommer, also der Sommer 2021, da gab es ein Problem bei Google und das ist der zweite Fall. Und zwar, Google hat so Classifier gebaut, das heißt, Google hat jetzt nicht so eine – braucht jetzt nicht so eine harte Regel und sagt, “Wenn das und das, dann das und das”, sondern sie trainieren quasi eine Maschine darauf, solche Soft 404-Fälle zu identifizieren. Und das hat Google auch gemacht. Und ja, da war die Schraube einfach ein bisschen groß. Da hat Google einfach legitime Seiten als Soft 404 klassifiziert.

Was war passiert? Es kann manchmal passieren, dass zum Beispiel im HTML Code das Wort “keine Ergebnisse” steht. Also auch hier ein klassisches Beispiel: Du hast einen Onlineshop und du hast eine Kategorieseite, auf der es keine Produkte gibt, weil eben gerade kein Produkt dieser Kategorie zugeordnet ist. Dann könnte dieser Classifier eben sagen, “Oh, diese Seite hier, die hat ja eigentlich null Ergebnisse, da ist dann nichts Relevantes drauf und deswegen klassifizierte ich sie auch als Soft 404.” So, und dieser Klassifizierer, der war eben einfach ein bisschen zu grob. Der hat eben legitime Seiten auch als solche – als Soft 404 erkannt. Und manchmal steht im HTML-Code sowas wie “keine Ergebnisse” oder “null Ergebnisse” oder so etwas und deswegen kann das passieren. Und wir hatten interessanterweise in der Agentur auch einen Fall, bei dem das passiert ist, weil die eben dieses Code-Schnipsel in jeder Seite drin hatten, dass legitime Seiten aus dem Index entfernt wurden.

 

Soft 404: Was musst Du machen?

So, das war jetzt viel Technikgedöns. Was bleibt für dich? Also: Bitte nutze die Google Search Console und da den Report “Abdeckung”, weil da würden Soft 404-Fehler angezeigt. Klick einfach oben alle Kategorien an, also die ganzen bunten Felder, da ist ja immer so eine Checkbox drin, hak die alle mal an und dann solltest du sehen, ob du Soft 404-Fehler hast oder nicht.

Noch mal: Es passiert relativ selten, aber es kann passieren. Wenn du das siehst, dann wird Google dir URLs anbieten, von denen sie eben geschlossen haben, dass das Soft 404-Seiten sind. Mehr Diagnose wird Google dir nicht bieten. Google wird nicht sagen, “Ich habe diese Seite jetzt rausgenommen, weil -“, sondern dann musst du jetzt eben in die Diagnose gehen und sagen, ja, was ist denn falsch an der Seite? Zum Beispiel, ist es ein Produkt, was nicht mehr lieferbar ist? Zum Beispiel, ist es eine Kategorie mit null Produkten? Aber auch zum Beispiel, steht das Wort “keine Ergebnisse” aus Versehen auf der Seite drauf? Also bitte, guck da mal nach, ob du das Problem hast und vor allem, guck regelmäßig nach, weil es kann sich natürlich auch immer im laufenden Betrieb da was einschleichen.

The following two tabs change content below.

Markus Hövener

Markus Hövener ist Gründer und SEO Advocate der auf SEO und SEA spezialisierten Online-Marketing-Agentur Bloofusion. Als geschäftsführender Gesellschafter von Bloofusion Germany ist er verantwortlich für alle Aktivitäten in Deutschland, Österreich und der Schweiz. Markus Hövener ist Buchautor, Podcaster, Autor vieler Artikel und Studien rund um SEO und verantwortlich für das suchradar.

Markus hat vier Kinder, spielt in seiner Freizeit gerne Klavier (vor allem Jazz) und genießt das Leben.

Kommentieren