Canonical-Tags für PDF- und andere Nicht-HTML-Dateien

27. Juni 2011 | Von in SEO

Ich bin die Tage schon über einen Blog-Beitrag von Google gestolpert:
Supporting rel=”canonical” HTTP Headers

Und Eric hat heute auch noch was in seinem Blog dazu geschrieben:
Links auf PDF-, PPT-, Word- und andere Dokumente per Canonical “verwalten”

Also, in aller Kürze: Canonical-Tags sind super, aber sie können eben nur ein HTML-Seiten vorkommen. Es wäre aber auch interessant, das für andere Dateitypen zu machen. So könnte eine PDF-Datei per Canonical-Tag auf die HTML-Version “linken”. Google-Besucher kämen dann bevorzugt auf die HTML-Seite und eben nicht auf das PDF.

Interessant ist das auf alle Fälle, aber eben auch mit einigem Konfigurationsaufwand verbunden, denn das Tag muss eben in den HTTP-Header eingebaut werden. Das geht natürlich über die Konfiguration des Web-Servers, ist aber eben etwas umständlich.

Für den Apache gibt es da dankenswerterweise das Modul mod_headers, das man genau dafür nutzen kann. Im folgenden Beispiel möchte ich, dass das PDF http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/corporate-blogs.pdf als Canonical-Tag auf die HTML-Seite http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml verweist.

Das geht mit den folgenden Zeilen Code, die man z. B. in der .htaccess unterbringen kann:

<Files corporate-blogs.pdf>
Header append Link “<http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=\”canonical\””
</Files>

Statt <Files> kann man je nach Setup natürlich auch <FilesMatch> nutzen.

Im HTTP-Header wird es dann auch korrekt angezeigt:

HTTP/1.1 200 OK
Date: Mon, 27 Jun 2011 13:10:33 GMT
Server: Apache/2.2.10 (Linux/SUSE)
Last-Modified: Tue, 09 Oct 2007 08:36:17 GMT
ETag: “9a2002-7deb7-43c0b4339a240″
Accept-Ranges: bytes
Content-Length: 515767
Link: <http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=”canonical”
Connection: close
Content-Type: application/pdf

Wenn man die Canonicals wie im obigen Fall Link für Link implementiert, hat man natürlich einiges zu tun. Besser ist es daher, wenn man hier Regeln benutzt, um aus der PDF-URL automatisch auf die dazugehörige HTML-URL zu schließen. Da zahlt es sich dann wirklich aus, wenn man seine Website immer brav strukturiert hat.

Insgesamt ist das ganze also eher für große Websites mit hunderten von PDFs, DOCs, XLSs und so weiter interessant. Da fallen wir also schon einige Kunden ein, für die das dann doch spannend sein könnte. In jedem Fall kommt es in unseren internen SEO-Best-Practice-Leitfaden.

The following two tabs change content below.
Avatar-Foto

Markus Hövener

Markus Hövener ist Gründer und SEO Advocate der auf SEO und SEA spezialisierten Online-Marketing-Agentur Bloofusion. Als geschäftsführender Gesellschafter von Bloofusion Germany ist er verantwortlich für alle Aktivitäten in Deutschland, Österreich und der Schweiz. Markus Hövener ist Buchautor, Podcaster und Autor vieler Artikel und Studien rund um SEO.

Markus hat vier Kinder, spielt in seiner Freizeit gerne Klavier (vor allem Jazz) und genießt das Leben.

2 Kommentare zu “Canonical-Tags für PDF- und andere Nicht-HTML-Dateien”

  1. Avatar-Foto Benjamin Löwen

    Super nach so einer Möglichkeit habe ich schon lange gesucht. Bislang habe ich PDFs, in der Regel, per Robots ausgeschlossen, es sei denn im PDF war ein Mehrwert.

    Genial ist das man den Header auch bei anderen Dateien mitgeben kann, hiermit lässt sich sicher einiges SEOmäßig anstellen und eventuell kann man so etwas Performance für unnötiges einsparen 🙂

  2. Avatar-Foto Knut

    Endlich geht das, dafür kenne ich auch einige Anwendungsfälle

Kommentieren